본문 바로가기

통계

두 모평균 차이의 가설검정하는 법(σ를 모르는 경우)

이전 글에서는 σ를 아는 경우에 대해서 알아보았는데, 사실 가설검정을 할 때 σ를 아는 경우는 거의 없다. 그래서 두 모평균 차이의 가설검정은 σ를 모르는 경우가 대부분인데, σ를 모르는 경우에는 t분포를 사용한다. 그리고 검정통계량 구하는 공식은 아래와 같은데, 신뢰구간에서 사용한 공식을 그대로 사용한다.

일단 검정통계량 공식에 있는 sp합동표준편차라고 부르는데, 두 집단의 표본을 모아서 한 번에 계산한 표준편차이다. 그리고 합동표준편차를 사용하는 이유는 데이터의 신뢰도를 올리기 위해서라는 말이 있는데, 사실 별로 효과는 없다. 그래서 계산하기 귀찮게 공식만 1개 늘어난 셈인데, 그럼에도 일반적으로 사용하는 공식이기에, 합동표준편차를 사용하려고 한다. 그리고 구하는 법은 아래와 같다.

 


그리고 기각역을 구할 때는 두 집단의 자유도를 서로 더해줘야 하는데, 두 집단의 자유도 n1-1n2-1을 서로 더해보면, n1-1+n2-1=n1+n2-2가 나온다. 그리고 이렇게 두 집단의 자유도를 서로 더하는 이유는, 기각역을 1개만 만들기 위해서이다. 왜냐하면 자유도를 따로따로 계산하면 기각역이 2개 생기는데, 가설검정은 기각역이 1개만 있으면 되기에, 두 집단의 자유도를 서로 더해버린다.

 


또 σ를 모르는 경우에는 기본적으로 t분포를 사용하지만, 표본의 수가 많아지면 정규분포를 사용한다. 왜냐하면 t분포는 표본의 수가 적을 때 사용하려고 만든 분포이기에, 표본의 수가 많아지면 t분포표를 사용할 수가 없다.(t분포표는 표본 31개 이하의 값 위주로 구성되어 있다) 그래서 문제를 풀 때 n1+n2-2t분포표에 있는지를 확인한 다음, 없으면 정규분포를 사용하면 된다. 자세한 내용은 여기를 (참고)하면 된다.

 


어쨌든 표본의 수가 많아지면 정규분포를 사용하는데, 공식은 이전 글에서 다루었던 σ를 아는 경우와 비슷하다. 단지 σ를 모르기 때문에, 모분산 σ2 대신 표본분산 s2을 사용한다. 그리고 검정통계량에 있는 μ1-μ2는 가설 속의 모평균이라서, 귀무가설과 대립가설에 나오는 0을 그대로 대입하면 된다.(가끔 문제를 응용해서 0 이외에 다른 수치를 사용하기도 한다)