본문 바로가기

통계

이원배치법 구하는 법(반복이 없는 경우)

먼저 분산분석으로 여러 실험을 할 때, 평균에 영향을 주는 요소를 보통 요인이라고 부르는데, 요인이 2개인 경우에는 이원배치법을 사용한다고 했었다.(참고) 그리고 이원배치법은 크게 반복이 없는 경우반복이 있는 경우이렇게 2가지로 나뉜다.(이원배치법은 보통 첫 번째 요인에 해당하는 집단을 A라고 표기하고, 두 번째 요인에 해당하는 집단을 B라고 표기한다)

 


참고로 반복이란 두 요인의 각 집단이 서로 만나는 곳의 표본 수를 나타내는 말인데, 표본이 1개면 반복이 없다고 하고, 표본이 2개 이상이면 반복이 있다고 한다.(그냥 여러 번 반복해서 표본을 뽑았기 때문에, 반복이 있다고 하는 것이다) 그런데 계산하는 방법이 약간 다르므로, 이번 글에서는 반복이 없는 경우에 대해서만 알아보자.

 


일단 이원배치법은 일원배치법과는 달리 요인이 2개이므로, 가설을 세울 때는 각 요인 별로 따로따로 세워야 한다. 그래서 이원배치법(반복이 없는 경우)가설을 2개 세워야 하는데, 예를 들어 위의 반복이 없는 경우를 가지고 한 번 가설을 세워보면, 일단 첫 번째 요인은 집단이 4개이므로 첫 번째 가설은 μ4까지 표현하고, 두 번째 요인은 집단이 3개이므로 두 번째 가설은 μ3까지 표현하면 된다.

 


또 이원배치법(반복이 없는 경우)의 분산분석표를 한 번 살펴보면 아래와 같은데, 일원배치법이랑 비슷하다는 것을 알 수 있다. 그리고 실제로 기본적인 계산방법은 서로 비슷한데, 단지 이원배치법은 요인이 2개라서 두 번째 요인에 해당하는 값들이 추가됐을 뿐이다. 그래서 두 번째 요인의 집단 간에 발생하는 치우침을 요인제곱합(SSB)이라고 하고, 두 번째 요인의 평균제곱을 MSB라고 하며, 두 번째 요인에 해당하는 F값도 하나 추가되었다.(위에서 가설을 2개 세운다고 했었는데, 이 추가된 F값으로 두 번째 가설을 검정한다) 참고로 자유도에서 a는 첫 번째 요인의 집단 수를 나타내고, b는 두 번째 요인의 집단 수를 나타낸다.