상관계수 구하는 법
2019. 12. 16.
이전 글에서 상관분석은 점들이 모여 있는 밀도를 표현하기 위해서 수치를 사용하는데, 이 수치가 곧 상관계수라고 했었다. 그럼 상관계수 구하는 법을 알아보면, 일단 두 변수가 서로 상관관계가 있을 때, 점들이 퍼져있는 모습을 보면 일정한 패턴에 모여있다는 것을 알 수 있다. 그런데 점들이 일정한 패턴에 모여 있기는 하지만, 각각 어느 정도의 치우침은 발생한다.그래서 해당 치우침을 활용하면 상관계수를 구할 수 있는데, 통계에서 치우침을 나타내는 대표적인 척도가 “분산”이다. 그래서 분산을 활용해서 상관계수를 구하는데, 구하는 공식은 아래와 같다. 그럼 공식의 분자를 보통 “공분산”이라고 부르는데, 공분산에 대해서 알아보자. 일단 상관분석은 기본적으로 변수가 2개이기에, 치우침이 두 변수에 의해서 발생한다. ..