본문 바로가기

통계

상관계수의 가설검정하는 법

상관분석은 상관계수의 수치로 관계의 정도를 파악한다. 그런데 이전 글에서 상관관계의 정도를 나눠놓은 기준이 있기는 하지만, 눈대중으로 나눠놓은 것이라서 기준으로 사용하기에는 약간 못 미덥다고 했었다. 그래서 추가로 가설검정을 통해서 관계를 파악하는데, 기본적인 맥락은 다른 가설검정이랑 비슷하다. 그래서 예전에 다루었던 모평균의 가설검정이랑 비교를 해보면 이해하기가 편할 것이다.

일단 가설검정에서 가장 처음으로 귀무가설과 대립가설을 설정하는데, 보통 모수를 사용해서 가설을 설정한다. 왜냐하면 가설검정은 모수가 이럴 것이다라고 설정된 귀무가설과 대립가설 중에서, 어느 가설이 더 타당한지를 판단한 후, 하나의 가설을 선택하는 것이기 때문이다. 그래서 상관계수 역시 가설을 설정할 때는 모상관계수인 ρ()를 사용한다.

 


그런데 상관분석은 상관계수가 0에 가까울수록 상관관계가 없다는 뜻이고, -1 혹은 +1에 가까울수록 상관관계가 매우 강하다는 뜻이다. 그래서 귀무가설의 ρ=0상관관계가 없다는 뜻이고, 반대로 대립가설은 ρ≠0라고 나와 있는데, 0이 아니라는 것은, -1 혹은 +1에 가깝다는 소리다. 그래서 대립가설은 상관관계가 있다는 뜻이다.(상관분석은 대립가설로 만 사용하기 때문에, 양측검정만 한다)

 


다음으로 상관계수의 검정통계량은 조금 어색할 수도 있는데, 모평균의 검정통계량이랑 비교해보면 이해하기가 편할 것이다. 어차피 같은 자리에 비슷한 개념이 들어간다.

 


그리고 상관계수의 가설검정은, 모상관계수인 ρ을 모르기 때문에 모상관계수는 이럴 것이다라는 가설을 세우는데, 모상관계수를 모르는 상태임에도 불구하고 검정통계량 공식을 보면 ρ0가 있다. 그런데 이 ρ0는 실제의 모상관계수가 아니라 가설 속의 모상관계수이다.(귀무가설과 대립가설에 나오는 모상관계수) 그래서 오른쪽 밑에 0을 넣어서 ρ0라고 표기하는데, 검정통계량을 구할 때는 귀무가설과 대립가설에 나오는 수치를 그대로 대입하면 된다.(대부분 0을 대입하는데, 상관계수는 응용으로 0 이외에 다른 수치는 잘 사용하지 않는다)

 


그리고 상관계수의 가설검정은 기본적으로 t분포를 사용하는데, 한 가지 주의할 것은 자유도가 n-2라는 것이다.(검정통계량에도 n-2가 들어간다) 보통 대부분의 가설검정은 변수를 한 개만 사용한다.(μ, p, σ2) 그리고 두 모집단의 가설검정도 마찬가지인데, 예를 들어 두 모평균에서는 μ1μ2를 사용하기는 하지만, 결국 변수는 μ 하나다. 그런데 상관분석은 xy 이렇게 두 개의 변수를 사용하기 때문에, 각 변수마다 따로따로 -1을 하면 최종적으로 -2가 된다.(참고로 상관계수의 가설검정은 기본적으로 t분포를 사용하지만, n30이면 정규분포를 사용한다. 하지만 n이 크면 상관계수를 구하는 것이 힘들어서, 실질적으로 정규분포를 사용할 일은 거의 없다)


'통계' 카테고리의 다른 글

회귀분석 문제풀이  (1) 2019.12.22
회귀식 구하는 법  (1) 2019.12.21
회귀분석이란?  (2) 2019.12.20
상관계수의 가설검정 문제풀이  (0) 2019.12.19
상관계수 문제풀이  (1) 2019.12.17
상관계수 구하는 법  (2) 2019.12.16
상관계수란?  (1) 2019.12.15
상관분석이란?  (0) 2019.12.14