본문 바로가기

통계

모평균의 가설검정 문제풀이(σ를 아는 경우)

이전 글에서 모평균의 가설검정은 모평균이 이럴 것이다라는 2개의 가설 중에서, 하나의 가설을 선택하는 것이라고 했었는데, 문제를 풀 때는 먼저 문제에서 주어진 상황을 파악하여, 귀무가설과 대립가설을 세운 다음 검정통계량을 구하면 된다. 그리고 기각역을 구해서 검정통계량과 서로 비교하면 되는데, 검정통계량이 어디에 위치하느냐에 따라서, 귀무가설의 채택과 탈락 여부를 판단할 수 있다.

 

 

 

1. 어느 한 건전지의 평균 수명은 300일이라고 알려져 있는데, 일부에서는 300일이 아니라는 의견이 나오고 있다. 그래서 해당 건전지 25개를 표본으로 뽑아 조사하였더니, 평균수명은 310일이 나왔고, 그동안 수집한 자료를 분석한 결과 표준편차는 30일이라고 한다. 이때 어느 의견이 더 타당한지 유의수준 5%에서 검정하시오.

대립가설로 건전지의 평균수명은 300일이 아니라는 의견이 나왔는데, 300일보다 작은지 아니면 큰지는 거론되지 않았다. 그래서 대립가설은 같지 않다로 설정한다. 그리고 검정통계량을 구해보면 1.67이 나온다.

 


그다음 기각역을 구해보면, 일단 유의수준 α=0.05인데, 양측검정이므로 α/2=0.025에 해당하는 값을 표준정규분포표에서 찾아야 한다. 그런데 0.025는 정규분포 그래프의 오른쪽 면적에 해당하는데, 표준정규분포표는 왼쪽 면적만 다루기에 1-0.025=0.975에 해당하는 값을 찾아야 한다. 그래서 표준정규분포표()에서 확률 0.975에 가장 가까운 Z값을 찾으면 1.96이 나오는데, 양쪽으로 설정해야 하므로 기각역은 ±1.96이다. 그럼 검정통계량이 채택역안에 위치하므로 귀무가설이 채택된다. 그래서 건전지의 평균수명은 300이라고 할 수 있다.

 


 

 

 

2. 과자를 생산하는 A회사에서는 자신들이 생산하는 과자의 평균 중량이 50g이라고 주장하고 있다. 하지만 소비자들은 절대 그럴 일이 없다며, 평균 중량은 50g보다 작을 것이라고 주장한다. 그래서 어느 주장이 더 맞는지를 조사하기 위해서 해당 과자 100개를 표본으로 뽑았더니, 평균 중량은 41g이 나왔고, 과거의 데이터를 분석해보니 표준편차는 20g이라고 한다. 이때 과자의 평균 중량에 대해서 어느 주장이 더 타당한지 유의수준 1%에서 검정하시오.

대립가설로 과자의 평균 중량은 50g보다 작다는 의견이 나왔으므로, 대립가설은 작다로 설정한다. 그리고 검정통계량을 구해보면 -4.5가 나오는데, 딱 봐도 왼쪽으로 치우친 값이라서, 굳이 기각역과 비교해보지 않아도 귀무가설이 기각(탈락)이라는 것을 알 수 있다.

 


그래도 기각역을 구해보면, 유의수준 α=0.01이므로 1-0.01=0.99에 해당하는 가장 가까운 Z값을 표에서 찾으면 2.33이 나온다. 그런데 왼쪽 기각역은 그래프의 왼쪽 좌표이므로 정규분포가 좌우대칭이라는 특징을 활용해서 앞에 -만 붙이면 된다. 그래서 기각역은 -2.33이다. 그럼 검정통계량이 기각역안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 과자의 평균 중량은 50g보다 작다고 할 수 있다.

 


 

 

 

3. 우리나라 남성의 평균수명은 75세라고 알려져 있는데, 최근에는 의학기술이 발달함에 따라 평균수명이 더 높아졌을 거라는 의견이 나오고 있다. 그래서 최근에 사망한 남성 30명의 평균수명을 조사하였더니, 평균수명은 79세가 나왔고, 과거의 자료를 분석해보니 표준편차는 10이라고 한다. 이때 남성의 평균 수명에 대해서 어느 가설이 더 타당한지 유의수준 10%에서 검정하시오.

대립가설로 남성의 평균수명은 75세보다 크다는 의견이 나왔으므로, 대립가설은 크다로 설정한다. 그리고 검정통계량을 구해보면 2.19가 나온다.

 


그다음 α=0.1이므로 1-0.1=0.9에 가장 가까운 Z값을 표에서 찾으면 1.28이 나오기에, 기각역은 1.28이다. 그럼 검정통계량이 기각역안에 위치하므로 귀무가설이 기각(탈락)된다. 그러므로 남성의 평균수명은 75세보다 크다고 할 수 있다.

 



참고로 신뢰구간이랑 마찬가지로, 가설검정에서 자주 사용하는 Z값도 몇 가지로 정해져 있다. 단지 신뢰구간은 α/2만 다루기 때문에 Z값이 3개로 정해져 있었는데, 가설검정은 αα/2를 모두 다루므로 Z값이 5개로 정해져 있다.(0.05가 중복이라서 5개다) 그래서 Z값을 미리 알아두면 매번 표준정규분포표를 찾는 번거로움을 없앨 수 있어서, 문제를 풀기가 편해지는데, 5개의 Z값은 아래와 같다.(신뢰구간과 3개는 겹친다)