본문 바로가기

통계

회귀식의 가설검정(분산분석) 문제풀이

일단 회귀식의 가설검정은 회귀식이 유용한지아니면 유용하지 않은지를 판단하는 것이다. 그래서 별개의 문제를 처음부터 다루는 것보다는, 이전에 회귀분석 문제풀이에서 다루었던 문제를, 그대로 다루는 것이 좋아 보인다. 단지 분산분석은 계산할 때 손이 많이 가기에, 한 문제만 다뤄보자. 참고로 회귀분석의 분산분석표는 아래와 같다.

 

 


1. 부모의 키와 자식의 키의 관계를 알아보기 위하여 무작위로 몇 명을 뽑아, 아버지의 키와 아들의 키를 조사하였더니 아래와 같이 나왔고, 해당 자료를 바탕으로 회귀식을 구하였더니 y()=98.25+0.45x가 나왔다. 이때 이 회귀식이 유용한지 유의수준 10%에서 검정하고, 추가로 결정계수도 구하시오.

아버지의 키(x):        160        165        170        175        180        185        190

   아들의 키(y):        172        174        168        181        177        183        184

회귀식의 가설검정은 회귀식이 유용한지아니면 유용하지 않은지를 판단하는 것인데, 귀무가설은 회귀식이 유용하지 않다는 뜻이고, 대립가설은 회귀식이 유용하다는 뜻이다.(기울기=0이면 회귀식이 쓸모가 없으므로)

 


다음으로 검정통계량은 분산분석으로 구하는데, 회귀분석에서는 회귀제곱합(SSR)과 오차제곱합(SSE)을 구해야 한다. 그런데 제곱합은 그 특성상 한 번에 계산하기가 힘들기 때문에, 표를 활용해서 해당 값을 구해보면, SSR=141.75가 나오고 SSE=74.25가 나온다. 마지막으로 SST는 따로 계산하지 않아도 SSR+SSE를 하면 되기에, SST=216이 나온다.

 




그리고 회귀자유도는 1이고 오차자유도는 7-2=5이며 총자유도는 7-1=6이다. 그럼 평균제곱은 제곱합/자유도로 구하면 되기에, “회귀제곱합/회귀자유도를 하면 MSR=141.75가 나오고 오차제곱합/오차자유도를 하면 MSE=14.85가 나온다. 마지막으로 검정통계량인 F값은 “MSR/MSE”를 해보면 9.55가 나온다.

 


그다음 기각역을 구해보면, 유의수준 α=0.1이고 자유도는 (1, 5)이므로,(각각 회귀자유도오차자유도이다) 해당하는 값을 F분포표()에서 찾으면 기각역은 4.06이 나온다. 그럼 검정통계량이 기각역안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 이 회귀식은 유용하다는 것을 알 수 있다.

 


추가로 분산분석표가 완성되면 결정계수를 쉽게 구할 수가 있는데, “회귀제곱합/총제곱합으로 구하면 된다. 그래서 결정계수는 141.75/216=0.6563이 나오는데, 아주 높은 수치는 아니지만, 그럼에도 해당 회귀식이 어느 정도는 정확하다고 판단할 수 있다.