표준편차 계산기

Standard deviation

숫자 목록을 붙여넣으면 계산기는 각 값에 대한 평균, 분산, 표준편차(표본 s의 경우 분모를 n−1로, 전체 집단 σ의 경우 분모를 n으로 사용함), 변동계수 및 z-점수를 반환합니다. 이는 데이터가 평균 주변에서 얼마나 분산되어 있는지를 파악하는 데 유용하며, 모든 매개변수 검정을 수행하기 전에 반드시 확인해야 할 핵심 진단 지표입니다.

표준편차는 어떻게 계산되는가

  1. 1

    숫자를 붙여넣으세요

    逗점, 공백 또는 줄 바꿈으로 구분됩니다. 비수치형 항목은 건너뛰어집니다.

  2. 2

    평균 X-바는 계산됩니다

    합계를 개수로 나눈 값.

  3. 3

    제곱 편차는 모두 합산됩니다.

    sum((x − x-bar)²).

  4. 4

    분할한 후 뿌리를 구합니다.

    표본의 경우: (n−1)으로 나누고 √를 취합니다. 전체 집단의 경우: n으로 나누고 √를 취합니다.

표본과 전체 집단 — 어느 경우에 어떤 것을 사용해야 하는가

사용 인구 수(n/ divisor) 사용 표본 수(n−1/ divisor)
전체 인구를 포함합니다 더 큰 집단에서 추출한 표본을 사용합니다
전체 직원 조사 수천 명 중에서 추출한 20명의 고객을 대상으로 한 표본 조사
특정 세션에서 던진 모든 10개의 주사위 생산 라인에서 측정된 데이터

n−1 나누기 함수(베셀 보정)는 표본 데이터로부터 집단 분산의 편향되지 않은 추정량을 도출합니다. 반면 n를 사용할 경우 실제 집단 분산이 체계적으로 과소평가됩니다. 대규모 표본(n)에서는 이 차이가 작아지지만, 소규모 표본에서는 여전히 상당한 영향을 미칩니다.

표준편차에 대한 직관

집합의 평균이 100이고 표준편차(SD)가 15인 경우(대략 정규분포를 가정할 때), 다음과 같이 표현할 수 있습니다:

이것이 바로 68–95–99.7 규칙으로, 경험적 규칙이라고도 불립니다. IQ 점수, 인간의 신장 및 다양한 자연적 측정값들은 이 규칙을 매우 정확하게 따릅니다.

변동계수

CV = 표준편차 / 평균. 무단위의 분산 측정 지표로, 서로 다른 평균을 가진 데이터 세트 간의 변동성을 비교할 때 유용하다. CV가 0.1(10%)인 경우, 표준편차는 대략 평균의 10%에 해당한다. 0을 넘을 수 있는 데이터에는 의미가 없다.

Z점수

각 값 x에 대해 z = (x − 평균) / 표준편차를 계산합니다. 이 값이 평균보다 위 또는 아래로 몇 개의 표준편차만큼 위치하는지를 나타냅니다. |z| > 2는 일반적으로 이상치로 간주되며, |z| > 3은 정규분포 데이터에서는 매우 드물게 발생합니다.

흔한 오류들

자주 묻는 질문

엑셀에는 두 가지 함수가 있습니다: STDEV(표본용, 분모가 n−1인 경우)와 STDEVP(전체 집단용, 분모가 n인 경우)입니다. 사용하려는 함수가 원하는 표본 또는 전체 집단의 가정에 부합하는지 반드시 확인してください.

네 — 표준편차(SD)는 사용하는 측정 단위(센티미터, 달러, 초)와 동일합니다. 분산은 제곱 단위로 표시되므로 표준편차가 더 읽기 쉽습니다.

표본 표준편차(SD)는 n ≥ 2일 때 정의됩니다. 대략 n = 30 이하에서는 표준편차 주변의 신뢰구간을 보고하거나 견고한 대안 방법을 사용하는 것이 바람직합니다.

표준편차(SD)는 여전히 정의되어 있습니다. 비율 p에 대해 SD는 √(p × (1 − p))로 주어집니다. 1의 값이 60%를 차지하는 표본의 경우, 관측값의 수와 관계없이 SD는 √(0.6 × 0.4) ≈ 0.49입니다.

관련 도구