본문 바로가기

통계

회귀계수의 신뢰구간 구하는 법

어디까지나 회귀분석의 메인테마는, 회귀식을 활용해서 무엇인가를 예측하는 것이다.(가능하면 예측구간을 설정해서, 구간으로 예측하는 것이 좋다) 그리고 추가로 결정계수와 가설검정을 통해서 회귀식이 얼마나 잘 뽑혔는지를검증하는 것까지가 중요하지, 사실 신뢰구간 추정은 별로 중요하지 않다. 그냥 여러 책에서 종종 나오기에 다룰 뿐이다. 그래서 그냥 이런 것도 있다는 것만 알고 넘어가도 된다.(예측구간이 있기 때문에, 신뢰구간의 필요성이 떨어진다)

먼저 모회귀식을 보면 y절편 β0와 기울기 β1이 있는데, y절편과 기울기를 편의상 회귀계수라고 부른다. 그래서 회귀계수의 신뢰구간은 “y절편의 신뢰구간기울기의 신뢰구간을 구하는 것이다.

 


그런데 회귀분석은 y절편보다는 기울기를 더 중요시하는 경향이 있어서, 보통 기울기의 신뢰구간만 구한다.(사실 두 신뢰구간 모두 그닥 중요하지 않다) 그래서 여기에서도 기울기의 신뢰구간만 다루려고 하는데, 일단 신뢰구간은 표본의 통계량을 가지고, “모집단의 모수가 이럴 것이다라고 구간추정 하는 것이다. 그래서 모회귀식의 기울기 β1을 중심으로 공식이 유도되었다.

 


그리고 공식이 복잡해보이기는 하지만, 예전에 예측구간을 구했을 때 사용했던 값들이 그대로 들어가기 때문에, 이미 예측구간을 구했다면 신뢰구간도 쉽게 구할 수 있다. 또 신뢰구간을 구할 때는 기본적으로 t분포를 사용하는데, 한 가지 주의할 것은 자유도가 n-2이다. 그리고 표본의 수가 n30이면 정규분포를 사용할 수가 있는데, 단지 표본의 수가 30개 이상이면 손으로 계산하기가 힘들어서, 실질적으로 정규분포를 사용할 일은 거의 없.