본문 바로가기

통계

두 모집단의 가설검정이란?

이전까지 다루었던 단일 모집단의 가설검정과 달리, 두 모집단의 가설검정은 집단 각각의 모수가 어떠한지를 검정하는 것이 아니라, 두 모집단의 모수가 서로 어떠한 관계에 있는지를 검정하는 것이다. 그리고 두 모수의 관계는 보통 같다” “크다” “작다이렇게 3가지로 나타내는데, 서로의 관계를 파악할 때는 뺄셈나눗셈을 사용한다.

먼저 모평균과 모비율은 뺄셈을 사용해서 관계를 나타낸다. 예를 들어 5-5=0인데, 5-50이 나온 이유는 두 숫자가 서로 같기 때문이다. 그래서 평균1-평균2=0”이면 두 평균의 크기는 서로 같다는 것을 알 수 있다.(“비율도 마찬가지이다) 다음으로 5-2=3인데, 5-2가 양수가 나온 이유는 왼쪽에 있는 숫자가 더 크기 때문이다. 그래서 평균1-평균2=양수이면 평균1의 크기가 더 크다는 것을 알 수 있다. 마지막으로 2-5=-3인데, 2-5가 음수가 나온 이유는 왼쪽에 있는 숫자 더 작기 때문이다. 그래서 평균1-평균2=음수이면 평균1의 크기가 더 작다는 것을 알 수 있다. 이렇게 뺄셈을 통해서 나온 값이 “0” “양수” “음수인지에 따라서, 두 집단의 평균과 비율이 서로 어떠한 관계에 있는지를 파악할 수 있다.



다음으로 모분산은 나눗셈을 사용해서 관계를 나타낸다.(나눗셈을 사용하는 이유는 확률분포때문인데, 모평균과 모비율은 뺄셈을 해도 정규분포나 t분포를 사용할 수 있지만, 모분산은 뺄셈을 하면 사용할 확률분포가 없다. 그래서 나눗셈을 한다) 예를 들어 8/8=1인데, 8/81이 나온 이유는 분자와 분모의 크기가 서로 같기 때문이다. 그래서 분산1/분산2=1”이면 두 분산의 크기는 서로 같다는 것을 알 수 있다. 다음으로 8/4=2인데, 8/41보다 큰 수가 나온 이유는 분자가 분모보다 더 크기 때문이다. 그래서 분산1/분산2=1보다 큰 수이면 분산1의 크기가 더 크다는 것을 알 수 있다. 마지막으로 4/8=0.5인데, 4/81보다 작은 수가 나온 이유는 분자가 분모보다 더 작기 때문이다. 그래서 분산1/분산2=1보다 작은 수이면 분산1의 크기가 더 작다는 것을 알 수 있다. 이렇게 나눗셈을 통해서 나온 값이 “1” “1보다 큰 수” “1보다 작은 수인지에 따라서, 두 집단의 분산이 서로 어떠한 관계에 있는지를 파악할 수 있다.(뺄셈은 0을 기준으로 하고, 나눗셈은 1을 기준으로 한다)



참고로 두 모집단의 가설검정에서 두 모수의 크기가 서로 완벽하게 같을 확률은 거의 없다.(예를 들어 서울 남자의 평균 키와 경상도 남자의 평균 키는 거의 비슷하기는 하겠지만, 정확히 똑같지는 않다) 하지만 통계는 100%의 정답을 추구하지 않고 어느 정도의 오차는 인정하기에, 수치가 어느 정도 비슷하면 그냥 서로 같다고 취급한다. 예를 들어 집단1의 평균은 102이고, 집단2의 평균은 100이라고 해보자. 그럼 두 집단의 평균은 서로 다르지만, 실상은 2밖에 차이가 나지 않아서 통계에서는 서로 같다고 취급한다. 마찬가지로 집단1의 분산은 50이고, 집단2의 분산은 53이라고 해보자. 그럼 두 집단의 분산은 서로 다르지만, 실상은 3밖에 차이가 나지 않아서 통계에서는 서로 같다고 취급한다.

 


물론 두 모수가 서로 같은지 아니면 다른지를 위에서처럼 눈대중으로 판단하는 것이 아니라, 수치를 활용한 정량적인 방법으로 하는데, 이 정량적인 방법이 바로 가설검정이다. 그리고 두 모수를 서로 비교할 때 수치의 차이가 어중간하면, 뺄셈과 나눗셈만으로 같다” “크다” “작다를 파악하기가 애매하다. 그래서 가설검정에서는 추가로 검정통계량과 기각역을 구해서 서로 비교하는 번거로운 과정을 거친다.