본문 바로가기

통계

귀무가설과 대립가설 설정하는 법

가설검정에서는 현재의 가설을 귀무가설이라고 하고, 새로운 가설을 대립가설이라고 하는데, 가설검정을 할 때 가장 처음으로 하는 것이 귀무가설과 대립가설 설정이다. 그런데 가설을 세울 때는 두 개의 가설이 정반대로 설정되어야 한다. 왜냐하면 가설검정은 귀무가설과 대립가설 중에서 어떤 가설이 더 타당한지를 판단하고, 하나의 가설만 양자택일하는데, 하나만 선택하기 위해서는 두 개의 가설이 서로 중복되지 않고 정반대여야 한다.

일단 귀무가설은 같다” “이상” “이하이렇게 3가지 유형이 있는데, 예를 들어 평균은 10과 같다” “비율은 10% 이상이다” “분산은 10 이하이다와 같이 세우면 된다. 그래서 귀무가설은 보통 =를 사용해서 설정한다.

 


그럼 대립가설은 귀무가설과 정반대여야 하므로 <>를 사용해서 설정하는데, 귀무가설과 중복되지 않기 위해서 미만초과를 사용한다. 그래서 위의 예를 활용하면 대립가설은 평균은 10과 같지 않다” “비율은 10% 미만이다” “분산은 10 초과이다와 같이 세울 수 있다.

 


그리고 귀무가설과 대립가설은 모집단의 모수가 이럴 것이다라는 것을 표현한 말이기 때문에, 모수인 μpσ2만 사용해서 가설을 세운다. 그래서 표본의 통계량은 그냥 계산을 위해서만 사용할 뿐, 귀무가설과 대립가설 설정할 때는 들어가지 않는다.



참고로 귀무가설을 세울 때, 이상과 이하일 때도 =으로만 나타내기도 하는데, 이것은 자칫 가설검정을 이해하는 데 방해가 될 수도 있다. 사실 같은 부등호보다는 =으로 나타내는 것이 더 편하기 때문에, =을 많이 사용하기는 하지만, 이 블로그에서는 가설검정이 양자택일이라는 점을 강조하기 위해서 로 표기하려고 한다.(귀무가설을 =으로만 나타내는 것이 정확한 것은 아니지만, 간편하기 때문에 편법으로 =을 많이 사용한다)

 


물론 정확하게는 문제에 나오는 문장을 읽어본 후, 더 적합한 걸 쓰는 게 좋기는 하다. 그래서 문장이 =와 더 잘 어울리면 =을 사용하고, 가 더 잘 어울리면 를 사용하는 것이 좋다. 하지만 여러 가지를 섞어서 쓰면, 복잡하고 헷갈릴 수 있으므로 차라리 하나로 통일하는 게 속 편하다. 그래서 둘 중에서 아무거나 사용해도 되는데, 그냥 자신이 쓰고 싶은 걸 사용하면 된다.