일단 회귀식의 가설검정은 회귀식이 “유용한지” 아니면 “유용하지 않은지”를 판단하는 것이다. 그래서 별개의 문제를 처음부터 다루는 것보다는, 이전에 “회귀분석 문제풀이”에서 다루었던 문제를, 그대로 다루는 것이 좋아 보인다. 단지 분산분석은 계산할 때 손이 많이 가기에, 한 문제만 다뤄보자. 참고로 회귀분석의 분산분석표는 아래와 같다.
1. 부모의 키와 자식의 키의 관계를 알아보기 위하여 무작위로 몇 명을 뽑아, 아버지의 키와 아들의 키를 조사하였더니 아래와 같이 나왔고, 해당 자료를 바탕으로 회귀식을 구하였더니 y(햇)=98.25+0.45x가 나왔다. 이때 이 회귀식이 유용한지 유의수준 10%에서 검정하고, 추가로 결정계수도 구하시오.
아버지의 키(x): 160 165 170 175 180 185 190
아들의 키(y): 172 174 168 181 177 183 184
회귀식의 가설검정은 회귀식이 “유용한지” 아니면 “유용하지 않은지”를 판단하는 것인데, 귀무가설은 “회귀식이 유용하지 않다”는 뜻이고, 대립가설은 “회귀식이 유용하다”는 뜻이다.(기울기=0이면 회귀식이 쓸모가 없으므로)
다음으로 검정통계량은 분산분석으로 구하는데, 회귀분석에서는 회귀제곱합(SSR)과 오차제곱합(SSE)을 구해야 한다. 그런데 제곱합은 그 특성상 한 번에 계산하기가 힘들기 때문에, 표를 활용해서 해당 값을 구해보면, SSR=141.75가 나오고 SSE=74.25가 나온다. 마지막으로 SST는 따로 계산하지 않아도 SSR+SSE를 하면 되기에, SST=216이 나온다.
그리고 회귀자유도는 1이고 오차자유도는 7-2=5이며 총자유도는 7-1=6이다. 그럼 평균제곱은 “제곱합/자유도”로 구하면 되기에, “회귀제곱합/회귀자유도”를 하면 MSR=141.75가 나오고 “오차제곱합/오차자유도”를 하면 MSE=14.85가 나온다. 마지막으로 검정통계량인 F값은 “MSR/MSE”를 해보면 9.55가 나온다.
그다음 기각역을 구해보면, 유의수준 α=0.1이고 자유도는 (1, 5)이므로,(각각 “회귀자유도”와 “오차자유도”이다) 해당하는 값을 F분포표(표)에서 찾으면 기각역은 4.06이 나온다. 그럼 검정통계량이 “기각역”안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 이 회귀식은 유용하다는 것을 알 수 있다.
추가로 분산분석표가 완성되면 결정계수를 쉽게 구할 수가 있는데, “회귀제곱합/총제곱합”으로 구하면 된다. 그래서 결정계수는 141.75/216=0.6563이 나오는데, 아주 높은 수치는 아니지만, 그럼에도 해당 회귀식이 어느 정도는 정확하다고 판단할 수 있다.
'통계' 카테고리의 다른 글
회귀계수의 신뢰구간 문제풀이 (9) | 2019.12.29 |
---|---|
회귀계수의 신뢰구간 구하는 법 (0) | 2019.12.28 |
회귀식의 가설검정(분산분석)하는 법 (0) | 2019.12.26 |
결정계수란? (4) | 2019.12.25 |
회귀분석의 예측구간 문제풀이 (0) | 2019.12.24 |
회귀분석의 예측구간 구하는 법 (0) | 2019.12.23 |
회귀분석 문제풀이 (1) | 2019.12.22 |
회귀식 구하는 법 (1) | 2019.12.21 |