본문 바로가기

통계

이원배치법 구하는 법(반복이 있는 경우)

먼저 이원배치법은 크게 반복이 없는 경우반복이 있는 경우로 나뉜다고 했었는데, 반복이란 두 요인의 각 집단이 서로 만나는 곳의 표본 수를 말한다. 그래서 표본이 1개면 반복이 없다고 하고, 표본이 2개 이상이면 반복이 있다고 하는데, 그냥 여러 번 반복해서 표본을 뽑았기 때문에 반복이 있다고 하는 것이다.

 


그럼 이번 글에서는 반복이 있는 경우에 대해서 알아보려고 하는데, 반복으로 여러 개의 표본을 뽑았을 때는 두 요인의 각 집단끼리의 궁합도 한 번 살펴봐야 한다. 예를 들어 아래에 있는 표를 한 번 살펴보면, A2B1이 만나면 수치가 크게 나오는 것을 알 수 있고, A3B3가 만나면 수치가 작게 나온다는 것을 알 수 있다. 이렇게 반복으로 여러 개의 표본을 뽑으면, 각 집단끼리 서로 영향을 주고받으면서, 평균이 높게 나오거나 혹은 평균이 낮게 나오는 경우가 생긴다.

 


그럼 이렇게 두 요인의 각 집단이 독립적으로 평균에 영향을 주는 것이 아니라, 위와 같이 두 요인의 각 집단이 서로 영향을 주고받으면서 동시에 평균에 영향을 주는 것상호작용”(相互: 서로 상, 서로 호)이라고 한다.(또는 교호작용이라고도 부른다) 그리고 상호작용의 제곱합을 SSA×B라고 하는데, SSA×B=SSAB-SSA-SSB로 구하면 된다.(분산분석은 백날 공식을 들여다보는 것보단, 직접 한 번 풀어보는 것이 훨씬 좋다. 그래서 자세한 계산은 문제풀이에서 다루려고 한다) 참고로 이전 글에서 알아보았던 반복이 없는 경우는 표본이 1개라서 상호작용을 계산할 수가 없다. 그리고 애초에 표본 1개는 그냥 우연히 그렇게 뽑히는 경우가 많아서, 표본 1개로 상호작용이 있는지를 판단하는 것은 약간 무리가 있다.

 


어쨌든 이원배치법의 반복이 있는 경우는 추가로 상호작용이 있는지도 파악해야 하는데, 그래서 가설을 3개 세워야 한다. 예를 들어 위의 표를 가지고 한 번 가설을 세워보면, 일단 첫 번째 요인은 집단이 4개이므로 첫 번째 가설은 μ4까지 표현하고, 두 번째 요인은 집단이 3개이므로 두 번째 가설은 μ3까지 표현한다. 마지막으로 상호작용에 관한 가설을 세우면 되는데, 귀무가설은 두 요인 사이에 상호작용이 없다라고 세우고, 대립가설은 두 요인 사이에 상호작용이 있다라고 세우면 된다.(보통 귀무가설은 =로 나타내고, 대립가설은 로 나타낸다. 그런데 같다(=)는 것은 곧 변화가 없다는 뜻이므로, 귀무가설은 상호작용이 없다는 뜻이다. 반대로 같지 않다()는 것은 곧 변화가 있다는 뜻이므로, 대립가설은 상호작용이 있다는 뜻이다)



반복이 있는 경우의 분산분석표를 한 번 살펴보면 아래와 같은데, 상호작용에 관한 값들이 추가된 것을 알 수 있다. 그래서 상호작용의 제곱합을 SSA×B라고 하고, 상호작용의 평균제곱을 MSA×B라고 하며, 상호작용에 해당하는 F값도 하나 추가되었다.(위에서 가설을 3개 세운다고 했었는데, 이 추가된 F값으로 세 번째 가설을 검정한다) 참고로 자유도에서 a는 첫 번째 요인의 집단 수를 나타내고, b는 두 번째 요인의 집단 수를 나타내며, r은 두 요인의 각 집단이 서로 만나는 곳의 표본 수(반복한 횟수)를 나타낸다.