본문 바로가기

통계

90%, 95%, 99% 신뢰구간의 차이

이전 글에서 신뢰할 수 있는 구간의 길이를 만든 것이 신뢰구간이라고 했었는데, 신뢰구간을 설정할 때는 확률분포의 1-α를 기준으로 설정한다. 그리고 1-α는 보통 90%, 95%, 99%를 많이 사용하는데, 3개를 한 번에 사용하는 것이 아니라, 3개 중에서 1개를 선택해서 신뢰구간을 설정한다. 그럼 각 신뢰구간이 서로 어떠한 차이가 있는지를 알아보자.

일단 조금 극단적이기는 하지만, 예를 들어 “99%의 신뢰구간“10%의 신뢰구간이 있다고 해보자. 그럼 99%의 신뢰구간은 신뢰도가 굉장히 높은 구간이기에, 신뢰도를 높이기 위해서는 구간의 길이가 길어질 수밖에 없다.(구간의 길이가 길수록, 모수가 구간 안에 포함될 확률은 올라가기에) 반대로 10%의 신뢰구간은 신뢰도가 굉장히 낮은 구간인데, 구간의 길이가 짧을수록 신뢰도는 낮아진다.(구간의 길이가 짧을수록, 모수가 구간 안에 포함될 확률은 내려가기에) 이렇게 신뢰구간은 %가 높을수록 구간의 길이가 길어지고, 반대로 %가 낮을수록 구간의 길이가 짧아진다.

 


그런데 어차피 모수를 추리하는 것이라면, 구간의 길이가 길어서 신뢰도가 높은 것이 무조건 좋다고 생각할 수도 있겠지만, 꼭 그렇다고는 할 수 없다. 왜냐하면 구간의 길이가 길어질수록 최종적으로 모수를 추리하기가 애매해진다. 또 극단적인 예를 들어 구간의 길이가 짧아서 1x3이라고 한다면, 모수는 1, 2, 3중에서 하나라고 추리할 수 있다.(귀찮으니 소수가 나오는 경우는 생략한다) 하지만 구간의 길이가 길어서 1x12라고 한다면, 모수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12중에서 하나가 되기에, 최종적으로 모수를 추리하기가 애매해진다.(현실에서는 구간추정을 참고해서, 어떠한 상황의 의사결정을 하는 경우도 있다. 그런데 모수를 추리하기가 애매하면, 최종적으로 의사결정하기도 애매해진다)

 


이렇게 신뢰구간은 구간의 길이가 짧을수록 최종적으로 모수를 추리하기가 편해지고, 반대로 구간의 길이가 길어질수록 모수를 추리하기가 애매해진다. 그래서 신뢰구간이 무조건 길다고 좋은 것은 아니다. 그래서 각각의 신뢰구간은 장단점이 있는데, 그것을 정리하면 아래와 같다.

 


그런데 사실 %의 차이가 그렇게 크지는 않아서, 각 신뢰구간의 차이도 그렇게 크지는 않다. 그래서 3개 중에서 자신이 사용하고 싶은 것을 1개 선택하면 되는데, 보통 95%를 많이 사용한다. 그리고 위의 내용은 그냥 90%, 95%, 99%의 차이를 설명하기 위해서 다룬 것일 뿐, 신뢰구간을 설정할 때 90% 밑으로 설정하는 경우는 거의 없다. 그리고 신뢰구간은 확률분포를 기반으로 설정하기 때문에, 99%의 신뢰구간도 길이가 매우 길지는 않다.