일단 예측구간은 회귀식을 활용해서 무엇인가를 예측한 후에, 해당 예측값을 구간으로 설정하는 것이다. 그래서 별개의 문제를 처음부터 다루는 것보다는, 이전에 “회귀분석 문제풀이”에서 다루었던 문제를, 그대로 다루는 것이 훨씬 좋아 보인다. 그럼 “회귀분석 문제풀이”에서 다루었던 문제의 예측구간을 구해보자.
1. 부모의 키와 자식의 키의 관계를 알아보기 위하여 무작위로 몇 명을 뽑아, 아버지의 키와 아들의 키를 조사하였더니 아래와 같이 나왔다고 한다. 그리고 해당 자료를 바탕으로 회귀식을 구하였더니 y(햇)=98.25+0.45x가 나왔고, 이 회귀식을 활용해서 아버지의 키가 165cm일 때, 아들의 키는 172.5cm가 될 것으로 예측하였다. 이때 아들의 키에 대해서 90%의 예측구간을 구하시오.
아버지의 키(x): 160 165 170 175 180 185 190
아들의 키(y): 172 174 168 181 177 183 184
예측구간은 공식이 굉장히 복잡하므로, 많이 헷갈릴 수 있다. 그리고 공식으로 한 번에 계산하기가 힘들기 때문에, 일단 공식에 들어가는 값을 먼저 표로 나타내자.
그리고 아버지의 키가 165cm일 때, 아들의 키는 172.5cm가 될 것으로 예측하였으므로, y0(햇)=172.5이고 x0=165이다. 그다음 90%의 신뢰수준이므로 α/2=0.05이고 자유도는 7-2=5이다. 그래서 해당하는 값을 t분포표(표)에서 찾으면 tα/2=±2.015가 나온다. 그러므로 예측구간을 구해보면, 아버지의 키가 165cm일 때, 아들의 키는 163.5017cm에서 181.4983cm 사이라고 추정할 수 있다.
무엇인가를 예측할 때, “172.5cm일 것이다”는 맞을 확률이 거의 없다. 하지만 구간으로 설정해서 “163.5017cm에서 181.4983cm 사이일 것이다”로 예측하면, 맞을 확률이 상당히 올라간다. 그래서 점추정보다는 구간추정으로 예측하는 것이 더 좋다.
2. 소득에 따른 신용카드 사용량을 알아보기 위하여 무작위로 몇 명을 뽑아, 월 소득 대비 신용카드 사용량을 조사하였더니 아래와 같이 나왔다. 그리고 해당 자료를 바탕으로 회귀식을 구하였더니 y(햇)=-25.1+0.417x가 나왔고, 이 회귀식을 활용해서 월 소득이 250만 원일 때, 카드 사용량은 79.15만 원이 될 것으로 예측하였다. 이때 카드 사용량에 대해서 95%의 예측구간을 설정하시오.(단위는 만원)
월 소득(x): 100 200 300 400 500
카드 사용량(y): 30 57 76 140 197
예측구간은 공식을 한 번에 계산하기가 힘들다. 그래서 위의 문제와 마찬가지로 먼저 공식에 들어가는 값을 표로 나타내면 아래와 같이 나온다.
그리고 월 소득이 250만 원일 때, 카드 사용량은 79.15만 원이라고 예측하였으므로, y0(햇)=79.15이고 x0=250이다. 그다음 95%의 신뢰수준이므로 α/2=0.025이고 자유도는 5-2=3이다. 그래서 해당 값을 표에서 찾으면 tα/2=±3.182가 나온다. 그러므로 예측구간을 구해보면, 월 소득이 250만 원일 때, 카드 사용량은 16.6404만 원에서 141.6596만 원 사이라고 추정할 수 있다.
참고로 어디까지나 회귀분석의 메인테마는, 회귀식을 활용해서 무엇인가를 예측하는 것이다.(가능하면 예측구간을 설정해서, 구간으로 예측하는 것이 좋다) 그래서 이 부분에 무게를 두는 것이 좋다. 그리고 이후로 다룰 회귀분석 관련 글들은, 그냥 회귀식이 얼마나 잘 뽑혔는지를 검증하는 과정에 지나지 않는다.(모집단 추정도 한다) 단지 지루한 과정이다. 그럼 다음 글에서는 결정계수에 대해서 알아보자.
'통계' 카테고리의 다른 글
회귀계수의 신뢰구간 구하는 법 (0) | 2019.12.28 |
---|---|
회귀식의 가설검정(분산분석) 문제풀이 (0) | 2019.12.27 |
회귀식의 가설검정(분산분석)하는 법 (0) | 2019.12.26 |
결정계수란? (4) | 2019.12.25 |
회귀분석의 예측구간 구하는 법 (0) | 2019.12.23 |
회귀분석 문제풀이 (1) | 2019.12.22 |
회귀식 구하는 법 (1) | 2019.12.21 |
회귀분석이란? (2) | 2019.12.20 |