본문 바로가기

통계

회귀분석이란?

먼저 회귀분석은 상관분석이랑 비스무리한데, 그렇기에 상관분석의 연결 선상에서 이해하는 것이 좋다. 일단 이전 글에서 다루었던 상관분석은 두 변수가 서로 상관관계가 있는지를 파악하는 분석이라고 했었다. 그리고 두 변수가 서로 상관이 있을 때, 점들이 퍼져있는 모습을 보면 일정한 패턴에 모여있다고도 했었다.

그런데 이 일정한 패턴을 활용하면 무엇인가를 예측할 수 있게 된다. 예를 들어 어느 한 회사에서 광고를 5번 했을 때, 판매량은 몇 개일까?”를 조사한다고 해보자. 그럼 회귀분석을 활용하면 해당 판매량을 예측할 수 있는데, 일단 점들이 모여 있는 일정한 패턴을 파악하여, 공식을 구해보니 y=50+30x가 나왔다고 하자. 그러면 광고를 5(x) 했을 때, 판매량(y)200개가 되는 것을 알 수 있다.

 


이렇게 점들이 퍼져있는 모습에서 일정한 패턴을 찾아내고, 이 일정한 패턴을 활용해서 무엇인가를 예측하는 분석이 회귀분석이다. 물론 이렇게 구한 값은, 단지 예측값일 뿐 정답은 아니다. 하지만 무엇인가를 예측할 때, 눈대중으로 막 잡은 수치보다는 훨씬 신뢰할 만하다. 그리고 상관분석은 단순하게 두 변수가 서로 상관관계가 있는지만 파악했지만, 회귀분석은 상관분석에서 한발 더 나아가 무엇인가를 예측할 수 있기에, 상관분석의 업그레이드판이라고 생각해도 된다. 어쨌든 회귀분석을 사용하면 여러 상황을 예측할 수 있는데, 몇 가지 사례를 들어보면 아래와 같다.

 








참고로 회귀분석에서 새로운 표본을 뽑았을 때, 이 표본은 전혀 별개의 값이 나오는 것이 아니라, 평균으로 돌아가려는 특성이 있다. 그래서 이름이 회귀분석이다.(回歸: 돌 회, 돌아갈 귀) 그런데 새로운 표본이 평균으로 돌아가려는 특성이 있을 뿐, 돌아가려는 특성을 분석하지는 않는다. 그냥 무엇인가를 예측하는 예측기법이다. 그래서 회귀분석이라는 이름은 어울리지 않는.

 


회귀분석은 어디까지나 무엇인가를 예측하는 분석이다. 그래서 이름을 붙이려면, “무엇인가를 예측하는 분석이라는 것을 한눈에 파악할 수 있는 이름이 좋다.(돌아간다는 뜻을 지닌 회귀말고) 그런데 이름을 회귀분석이라고 지어놓아서, 회귀분석의 여러 계산을 다 해놓고도, 정작 회귀분석이 뭐하는 분석인지 모르는 사람도 많다. 어쨌든 회귀분석으로 무엇인가를 예측하기 위해서는 일단 공식을 잘 뽑아야 하는데, 이 공식을 보통 회귀식이라고 부른다. 그럼 다음 글에서는 회귀식 구하는 법을 알아보자.

'통계' 카테고리의 다른 글

회귀분석의 예측구간 문제풀이  (0) 2019.12.24
회귀분석의 예측구간 구하는 법  (0) 2019.12.23
회귀분석 문제풀이  (1) 2019.12.22
회귀식 구하는 법  (1) 2019.12.21
상관계수의 가설검정 문제풀이  (0) 2019.12.19
상관계수의 가설검정하는 법  (1) 2019.12.18
상관계수 문제풀이  (1) 2019.12.17
상관계수 구하는 법  (2) 2019.12.16