본문 바로가기

통계

모비율의 신뢰구간 표본크기의 결정

표본크기의 결정은 적당한 수준의 표본 수를 구하는 방법인데, 이전에 다루었던 모평균의 신뢰구간 표본크기의 결정이라는 글에서도 언급했지만,(참고) 통계는 100%의 정답을 다루기보다는, 확률로 값을 표현한다. 즉 어느 정도의 오차는 인정하는 것이다. 그러나 어느 정도의 오차는 인정해도, 일정 크기 이상의 오차는 인정하지 않는 , 최대한으로 허용하는 오차가 허용오차라고 했었다.(허용오차는 보통 “E”라고 표기한다)

그리고 신뢰구간은 점추정치를 기준으로 ±허용오차를 해서 만든 구간인데, 허용오차는 신뢰구간의 한쪽 구간과 동일하므로, 모비율의 표본크기를 결정하는 공식은 아래와 같다. 그런데 표본의 크기를 결정한다는 것은 아직 표본을 뽑기 전이므로, 표본비율은 아직 모르는 상태다. 그래서 공식의 표본비율에는 가장 작지도 가장 크지도 않은 어중간한 수치를 대입하는데, 비율은 0~1 사이의 값만 나오므로, 딱 중간값인 0.5를 대입한다.

 


그런데 표본의 크기를 결정하는 것이므로 n을 중심으로 공식을 재배열해야 하는데, 재배열해서 얻어낸 공식은 아래와 같다. 그럼 문제 하나를 풀어보자.

 

 

 


 

1. 선거를 앞두고 A후보의 지지율을 조사하려고 하는데, 이때 표본의 크기를 얼마로 할 것인지를 결정하려고 한다. 그래서 허용오차를 0.04로 설정하였을 때, 신뢰수준 99%에 적합한 표본크기를 구하시오.

99%의 신뢰수준이기에 Zα/2=2.575이고 허용오차 E=0.04이다. 그래서 공식에 대입해보면 1036.0352가 나오므로, 적당한 표본크기는 1037이 나온다.(표본의 크기는 개수라서, 소수점은 필요가 없다. 그리고 소수점인 0.0352를 처리하려면, 어쨌든 1명이 더 필요하기에, 반올림이 아니라 올림을 한다)