본문 바로가기

통계

모평균의 가설검정하는 법(σ를 아는 경우)

모평균의 가설검정은 모평균인 μ가 이럴 것이다라고 설정된 귀무가설과 대립가설 중에서, 어느 가설이 더 타당한지를 판단한 후, 하나의 가설을 선택하는 것이다. 그리고 신뢰구간과 마찬가지로, 모평균의 가설검정 크게 σ를 아는 경우σ를 모르는 경우로 나뉘는데, 이번에는 먼저 σ를 아는 경우에 대해서 알아보자.

사실 무엇인가를 조사할 때, 모표준편차인 σ를 아는 경우는 거의 없다. 하지만 특정 기업이나 조사기관에서는 오랜 기간에 걸쳐서 데이터를 수집하기도 하는데, 이런 데이터가 모집단의 모수는 아니지만, 그 수가 워낙에 많기 때문에 그냥 모수 취급하기도 한다. 예를 들어 무엇인가를 조사를 할 때, 표본 30개를 뽑아서 얻어낸 표준편차보다는, 기존에 오랜 시간에 걸쳐서 수집한 수백 개혹은 수천 개에서 얻어낸 표준편차가 훨씬 더 정확할 것이다. 그래서 이렇게 오랜 시간에 걸쳐서 얻어낸 표준편차가 모표준편차는 아니지만, 그럼에도 데이터의 신뢰성이 훨씬 높기에 그냥 모표준편차로 취급한다. 그런데 사실 이런 경우는 그렇게 흔하지가 않아서, 그냥 σ를 알고 있다고 가정(假定: 거짓 가, 정할 정)한 거라고 생각하는 게 더 편할 것이다.(참고)

 


그리고 가설검정은 귀무가설과 대립가설 중에서 하나를 양자택일하는데, 귀무가설과 대립가설을 세울 때는 수치를 통일해야 한다. 왜냐하면 수치가 서로 다르면 전혀 별개의 가설이 되어 버리기 때문에, 양자택일을 하지 못한다. 그래서 수치를 통일해야 하는데, 그냥 귀무가설의 수치에 맞춰서 대립가설의 수치를 똑같이 설정하면 된다.(원래부터 대립가설의 수치도 귀무가설과 동일하다. 하지만 가설검정에 익숙하지 않은 사람은 표본에서 얻어낸 표본평균이, 대립가설의 평균이라고 오해를 많이 한다)

 


그리고 모평균의 가설검정은 모평균을 모르기 때문에, “모평균인 μ가 이럴 것이다라는 가설을 세운다. 그런데 모평균을 모르는 상태임에도 불구하고, 검정통계량 공식을 보면 모평균 μ가 있다. 그래서 말이 안 되는 상황 같지만, μ는 실제의 모평균이 아니라 가설 속의 모평균이다.(귀무가설과 대립가설 속에 나오는 모평균) 그래서 오른쪽 밑에 0을 넣어서, μ0라고 표기한다. 그리고 검정통계량을 계산할 때, μ0에는 그냥 귀무가설과 대립가설에 나오는 수치를 그대로 대입한다.

 


참고로 가설검정도 신뢰구간과 마찬가지로 각각에 맞는 확률분포를 사용하는데, σ를 아는 경우에는 정규분포를 사용한다. 그런데 정규분포로 확률을 구하는 것이 아니라, 단지 그래프의 x축 좌표를 활용해서 기각역과 검정통계량을 구한다. 그리고 가설검정은 보통 모평균” “모비율” “모분산이렇게 3가지를 많이 하는데, 각각의 가설검정에서 사용하는 확률분포가 신뢰구간이랑 정확하게 겹친다. 그리고 기본 개념도 비슷한 점이 많아서, 신뢰구간에 어느 정도 익숙해졌다면 가설검정도 크게 어려울 건 없다.