본문 바로가기

통계

모비율의 가설검정 문제풀이

먼저 이전 글에서 모비율의 가설검정은 모비율인 p가 이럴 것이다라고 설정된 귀무가설과 대립가설 중에서, 하나의 가설을 선택하는 것이라고 했었다. 그리고 모비율의 가설검정은 기본적으로 정규분포를 사용하는데, 가설검정에서 사용하는 정규분포의 Z값은 미리 몇 가지로 정해져 있다. 해당 Z값은 아래와 같다.

 

 

 



1. 우리나라 성인 남자의 흡연율은 43%라고 알려져 있는데, 최근에는 담뱃값 인상으로 흡연율이 43%보다 낮아졌을 것이라는 의견이 나오고 있다. 이에 실제로 어떠한지를 알아보기 위해서, 성인 남자 1000명을 뽑아 흡연 여부를 조사하였더니, 흡연자는 총 420명이었다. 이때 흡연율이 43%보다 낮아졌다고 할 수 있는지, 유의수준 10%에서 검정하시오.

대립가설로 흡연율이 0.43보다 낮아졌을 것이라는 의견이 나왔으므로, 대립가설은 작다로 설정한다. 그리고 표본비율은 420/1000=0.42이므로, 검정통계량을 구해보면 -0.64가 나온다.

 


또 유의수준 α=0.1인데, 0.1에 해당하는 Z값은 1.28이다. 그런데 왼쪽 좌표라서 -를 붙여야 하므로 기각역은 -1.28이다. 그럼 검정통계량이 채택역안에 위치하므로 귀무가설이 채택된다. 그래서 성인 남자의 흡연율은 43%보다 낮아졌다고 할 수 없다.

 


 

 

 

2. 선거를 앞두고 A후보의 지지율은 대략 50%정도라고 알려져 있는데, 일부에서는 지지율이 50%를 넘을 것이라는 소리가 나오고 있다. 이에 실상을 파악하기 위해서 무작위로 400명을 뽑아 지지여부를 조사하였더니, 210명이 A후보를 지지하는 것으로 나왔다. 이때 A후보의 지지율이 50%를 넘는다고 할 수 있는지, 유의수준 5%에서 검정하시오.

대립가설로 A후보의 지지율이 50%를 넘을 것이라는 소리가 나오므로, 대립가설은 크다로 설정한다. 그리고 표본비율은 210/400=0.525이므로, 검정통계량을 구해보면 1이 나온다.

 


그다음 유의수준 α=0.05인데, 0.05에 해당하는 Z값은 1.645이므로, 기각역은 1.645이다. 그럼 검정통계량이 채택역안에 위치하므로 귀무가설이 채택된다. 그래서 A후보의 지지율은 50%를 넘는다고 할 수 없다.

 


 

 

 

3. 어느 공장에서 생산하는 제품의 불량률은 8%라고 알려져 있는데, 일부에서는 8%가 아니라는 의견이 나왔다. 이에 실제로 어떠한지를 알아보기 위해서, 표본 160개를 뽑았더니 불량품은 2개가 나왔다. 이때 제품의 불량률에 대해서 유의수준 5%에서 검정하시오.

대립가설로 제품의 불량률은 0.08(8%)이 아닐 수도 있다는 의견이 나왔는데, 0.08보다 작은지 아니면 큰지는 거론되지 않았다. 그래서 대립가설은 같지 않다로 설정한다. 그리고 표본비율은 2/160=0.0125이므로, 검정통계량을 구해보면 -3.15가 나온다.

 


그다음 유의수준 α=0.05인데, 양측검정이므로 α/2=0.025에 해당하는 Z값은 1.96이다. 그런데 양쪽으로 설정해야 하므로, 기각역은 ±1.96이 된다. 그럼 검정통계량이 기각역안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 제품의 불량률은 0.08이 아니라고 할 수 있다.

 


 

참고로 양측검정은 기각역이 양쪽으로 나뉘기 때문에, 단측검정에 비해서 검정력이 떨어진다.(참고) 그래서 되도록 양측검정보다는 단측검정을 하는 것이 더 좋은데, 위의 문제를 보면 검정통계량이 그래프의 왼쪽에 위치하고 있으므로, 굳이 오른쪽 기각역은 필요가 없다. 그래서 양측검정이 아니라 그냥 좌측검정만 하는 것이 더 효율적이다.(하지만 문제를 풀 때, 위와 같이 나오면 양측검정을 해야 한다) 그래서 가설검정을 할 때, 검정통계량의 위치를 파악해서 좌측검정이랑 우측검정만 하는 것도 하나의 방법일 수 있다.