표준 편차(Standard Deviation)는 데이터의 분포가 평균을 중심으로 얼마나 퍼져 있는지를 나타내는 통계적 지표이다. 표준 편차가 크면 데이터가 평균에서 멀리 퍼져 있고, 작으면 평균에 가까이 모여 있다.
정의
표준 편차는 분산(Variance)의 제곱근으로 정의된다.
- 모집단 표준 편차(σ)
- σ = sqrt( (1/N) * Σ (X_i - μ)² )
- 표본 표준 편차(s)
- s = sqrt( (1/(n-1)) * Σ (X_i - x̄)² )
여기서,
- X_i : 데이터의 각 값
- μ : 모집단의 평균
- x̄ : 표본의 평균
- N : 모집단 크기
- n : 표본 크기
- Σ : 합(sum) 연산
- sqrt : 제곱근 연산
표준 편차 계산 예제
다음 데이터 {2, 4, 6, 8, 10}의 표준 편차를 계산한다.
- 평균(μ) = (2 + 4 + 6 + 8 + 10) / 5 = 6
- 각 값의 편차 = (-4, -2, 0, 2, 4)
- 제곱한 값 = (16, 4, 0, 4, 16)
- 분산(σ²) = (16 + 4 + 0 + 4 + 16) / 5 = 8
- 표준 편차(σ) = sqrt(8) ≈ 2.83
표준 편차의 특징
- 항상 0 이상이다.
- 단위가 원래 데이터와 동일하다.
- 데이터의 변동성이 크면 표준 편차도 커진다.
- 평균이 달라도 분포의 퍼짐 정도는 표준 편차가 나타낸다.
표준 편차와 변동 계수
표준 편차는 데이터의 절대적인 변동성을 측정하지만, 변동 계수(Coefficient of Variation, CV)는 상대적인 변동성을 측정한다.
- 변동 계수(CV) = (표준 편차 / 평균) × 100%
변동 계수는 평균이 다른 두 데이터 집합을 비교할 때 유용하다.
표준 편차와 분산의 차이
표준 편차와 분산은 모두 데이터의 변동성을 측정하지만, 다음과 같은 차이가 있다.
구분 | 표준 편차 | 분산 |
---|---|---|
정의 | 데이터의 평균으로부터의 평균적인 거리를 나타냄 | 편차 제곱의 평균으로 변동성의 크기를 측정 |
수식 | σ = sqrt( (1/N) * Σ (X_i - μ)² ) | σ² = (1/N) * Σ (X_i - μ)² |
단위 | 원래 데이터와 동일 | 원래 데이터의 제곱 단위 |
해석 | 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 직관적으로 보여줌 | 변동성의 정도를 수학적으로 분석하는 데 유용 |
사용 용도 | 데이터의 실제 분포를 직관적으로 해석하는 데 사용 | 통계 모델에서 분산 분석(ANOVA) 및 확률 계산 등에 사용 |
같이 보기
참고 문헌
- Montgomery, D. C., & Runger, G. C. (2014). Applied Statistics and Probability for Engineers.