통계적 가설 검정
- Statistical Hypothesis Test
- 표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법
- 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
- 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식
- 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함
구성
- 귀무가설(Null Hypothesis): 직접 검정 대상이 되는 가설
- 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정
- 귀무가설은 기각(reject)이 목표
- 일반적으로 H0로 표기
- 대립가설(Alternative Hypothesis): 귀무가설에 대립되는 가설
- 새로운 주장 또는 실제로 입증하고 싶은 가설
- 대립가설은 채택(accept)이 목표
- 일반적으로 H1로 표기
- 임계값(Critical Value)
- 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값
- 유의 수준(Level of Significance)
- 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담)
- 일반적으로 α로 표기
- 0.05 라는 값을 가장 흔하게 사용
절차
- 1. 가설 설정
- 2. 유의수준 결정
- 3. 통계 분석
- 4. 임계값과 유의수준 비교
- 5. 기각 또는 채택
예시
- 상황
- 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다.
- 가설 설정
- 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다.
- 귀무가설(H0) : 평균 월급 = 150만 원
- 대립가설(H1) : 평균 월급 > 150만 원
- 유의수준 설정
- 통계 분석
- 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다.
- 100명에 대한 조사 결과는 155만 원이었다.
- 임계값과 유의수준 비교
- 표준정규분포표를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용
- 1.645 = (임계값 - 150) / 1.2
- 임계값 = 151.974
- 155만 원 > 151.974만 원
- 기각 또는 채택
- 귀무가설 기각, 대립가설 채택
- 즉, 올해 계약직 평균 월급은 작년의 150만 원보다 높다
두 가지 오류
- 제1종 오류: 귀무가설이 참임에도 이를 기각하는 오류
- 제2종 오류: 귀무가설이 거짓임에도 이를 채택하는 오류
기술사 기출
- 정보관리기술사 111회 1교시
- 정보관리기술사 121회 1교시
참고 문헌
출처: IT위키(IT위키에서 최신 문서 보기)
* 본 페이지는 공대위키에서 미러링된 페이지입니다. 일부 오류나 표현의 누락이 있을 수 있습니다. 원본 문서는 공대위키에서 확인하세요!