먼저 회귀분석은 상관분석이랑 비스무리한데, 그렇기에 상관분석의 연결 선상에서 이해하는 것이 좋다. 일단 이전 글에서 다루었던 상관분석은 두 변수가 서로 상관관계가 있는지를 파악하는 분석이라고 했었다. 그리고 두 변수가 서로 상관이 있을 때, 점들이 퍼져있는 모습을 보면 일정한 패턴에 모여있다고도 했었다.
그런데 이 일정한 패턴을 활용하면 무엇인가를 예측할 수 있게 된다. 예를 들어 어느 한 회사에서 “광고를 5번 했을 때, 판매량은 몇 개일까?”를 조사한다고 해보자. 그럼 회귀분석을 활용하면 해당 판매량을 예측할 수 있는데, 일단 점들이 모여 있는 일정한 패턴을 파악하여, 공식을 구해보니 y=50+30x가 나왔다고 하자. 그러면 광고를 5번(x) 했을 때, 판매량(y)은 200개가 되는 것을 알 수 있다.
이렇게 점들이 퍼져있는 모습에서 일정한 패턴을 찾아내고, 이 일정한 패턴을 활용해서 무엇인가를 예측하는 분석이 회귀분석이다. 물론 이렇게 구한 값은, 단지 예측값일 뿐 정답은 아니다. 하지만 무엇인가를 예측할 때, 눈대중으로 막 잡은 수치보다는 훨씬 신뢰할 만하다. 그리고 상관분석은 단순하게 두 변수가 서로 상관관계가 있는지만 파악했지만, 회귀분석은 상관분석에서 한발 더 나아가 무엇인가를 예측할 수 있기에, 상관분석의 업그레이드판이라고 생각해도 된다. 어쨌든 회귀분석을 사용하면 여러 상황을 예측할 수 있는데, 몇 가지 사례를 들어보면 아래와 같다.
참고로 회귀분석에서 새로운 표본을 뽑았을 때, 이 표본은 전혀 별개의 값이 나오는 것이 아니라, 평균으로 돌아가려는 특성이 있다. 그래서 이름이 “회귀”분석이다.(回歸: 돌 회, 돌아갈 귀) 그런데 새로운 표본이 평균으로 돌아가려는 특성이 있을 뿐, 이 “돌아가려는 특성”을 분석하지는 않는다. 그냥 무엇인가를 예측하는 예측기법이다. 그래서 “회귀”분석이라는 이름은 어울리지 않는다.
회귀분석은 어디까지나 “무엇인가를 예측하는 분석”이다. 그래서 이름을 붙이려면, “무엇인가를 예측하는 분석”이라는 것을 한눈에 파악할 수 있는 이름이 좋다.(돌아간다는 뜻을 지닌 “회귀” 말고) 그런데 이름을 “회귀”분석이라고 지어놓아서, 회귀분석의 여러 계산을 다 해놓고도, 정작 회귀분석이 뭐하는 분석인지 모르는 사람도 많다. 어쨌든 회귀분석으로 무엇인가를 예측하기 위해서는 일단 공식을 잘 뽑아야 하는데, 이 공식을 보통 회귀식이라고 부른다. 그럼 다음 글에서는 회귀식 구하는 법을 알아보자.
'통계' 카테고리의 다른 글
회귀분석의 예측구간 문제풀이 (0) | 2019.12.24 |
---|---|
회귀분석의 예측구간 구하는 법 (0) | 2019.12.23 |
회귀분석 문제풀이 (1) | 2019.12.22 |
회귀식 구하는 법 (1) | 2019.12.21 |
상관계수의 가설검정 문제풀이 (0) | 2019.12.19 |
상관계수의 가설검정하는 법 (1) | 2019.12.18 |
상관계수 문제풀이 (1) | 2019.12.17 |
상관계수 구하는 법 (2) | 2019.12.16 |