본문 바로가기

통계

두 모분산 차이의 신뢰구간 구하는 법

먼저 두 모분산의 신뢰구간 역시 이전에 알아보았던 평균비율이랑 마찬가지로, 두 집단의 모분산이 서로 얼마나 차이 나는지를 파악하는 것이다. 그런데 평균과 비율은 뺄셈을 활용해서 두 집단을 비교하였지만, 분산은 나눗셈을 활용해서 두 집단을 비교한다.(나눗셈을 활용하기에, “두 모평균두 모비율의 신뢰구간이랑은 조금 다르다)

예를 들어 4/4=1이 나오는데, 4/41이 나오는 이유는 분자와 분모의 크기가 서로 같기 때문이다. 다음으로 8/4=2가 나오는데, 8/41보다 큰 수가 나오는 이유는 분자와 분모의 크기가 서로 다르기 때문이다. 그래서 두 집단의 분산을 서로 나눴을 때, 1에 가까운 수가 나올수록 두 집단의 분산은 차이가 없다는 뜻이고, 반대로 1에서 멀리 떨어진 수가 나올수록 두 집단의 분산은 차이가 크다는 뜻이다. 이렇게 분산은 나눗셈을 활용해서 두 집단의 차이를 비교한다.(분모가 더 크면 “1보다 작은 수가 나오기는 하는데, 어차피 “1보다 큰 수가 나오는 경우와 동일함으로 여기에서는 생략한다)

 


그리고 뺄셈을 사용하지 않고 나눗셈을 사용하는 이유는 바로 확률분포 때문인데, 이전에 다루었던 평균과 비율은 뺄셈을 해도 정규분포나 t분포를 사용할 수 있었지만, 분산은 뺄셈을 하면 사용할 확률분포가 없다.(분산은 보통 카이제곱분포를 사용한다) 그래서 나눗셈을 하는 것이고, 2개의 분산을 나눴을 때 사용할 수 있는 분포가 F분포이다.(참고) 그래서 두 모분산 차이의 신뢰구간은 F분포를 사용하는데, 2개의 카이제곱분포 공식을 서로 나눠주면 F분포 공식이 나온다.(정확하게는 서로 나눠주기 이전에, 일단 각자의 자유도로 먼저 나눠준 다음, 서로 나눠줘야 F분포 공식이 나온다) 참고로 F분포 공식은 나중에 가설검정에서도 사용하는데, 가설검정에서는 공식이 살짝 변한다.

 


그리고 두 모분산의 신뢰구간은 F분포 그래프의 α/2에 해당하는 양쪽 x축 좌표를 사용하는데, 한 가지 조심할 것은 왼쪽 x축 좌표는 분자와 분모의 자유도가 서로 바뀐다.

 


그럼 위의 공식과 α/2에 해당하는 양쪽 x축 좌표를 활용하면, 신뢰구간의 공식을 구할 수 있는데, 두 모분산의 차이가 얼마인지를 추정하는 것이므로, σ12/σ22 중심으로 공식을 재배열하면 된다.