이원배치법은 크게 “반복이 없는 경우”와 “반복이 있는 경우”로 나뉘는데, 문제를 푸는 방법은 서로 비슷하다. 단지 반복으로 여러 개의 표본을 뽑았을 때, 두 요인의 각 집단이 서로 영향을 주고받으면서 동시에 평균에 영향을 주는 것을 “상호작용”이라고 하는데, 반복이 있는 경우에는 상호작용에 해당하는 값들을 추가로 구해주면 된다. 그리고 반복이 있는 경우의 분산분석표는 아래와 같다.
1. 어느 공장에서 4대의 “기계”와 3명의 “작업자”에 따라서 제품의 생산량에 차이가 있는지를 파악하기 위하여, 총 3번의 반복 실험을 한 결과 아래와 같이 나왔다고 한다. 그럼 기계와 작업자에 따라서 제품의 생산량에 차이가 있는지를 유의수준 5%에서 검정하시오.
일단 이원배치법의 “반복이 있는 경우”는 가설을 3개 세워야 하는데, 먼저 첫 번째 요인(기계)은 집단이 4개이므로 첫 번째 가설은 μ4까지 표현하고, 두 번째 요인(작업자)은 집단이 3개이므로 두 번째 가설은 μ3까지 표현한다.(참고로 평균이 같다는 것은 곧 제품의 생산량도 같다는 소리다. 그래서 귀무가설은 “생산량에 차이가 없다”는 뜻이고, 대립가설은 “생산량에 차이가 있다”는 뜻이다) 마지막으로 상호작용에 관한 가설을 세우면 되는데, 귀무가설은 “두 요인 사이에 상호작용이 없다”라고 세우고, 대립가설은 “두 요인 사이에 상호작용이 있다”라고 세우면 된다.
다음으로 “반복이 있는 경우”는 F값도 3개를 구해야 하는데, 제곱합을 계산할 때는 공식2를 사용한다고 했었다.(참고) 그리고 “반복이 있는 경우”는 표본의 특성상 계산을 할 때 표가 2개 있는 것이 편하다. 그래서 추가로 반복된 표본끼리의 합계인 Tab로 구성된 표를 1개 더 그린 후,(Tab로 SSAB를 구한다) “수정항 → SST → SSAB → SSA → SSB → SSA×B → SSE” 순으로 구하면 되는데, 먼저 수정항 CT=42025가 나오고 SST=477이 나온다. 다음으로 SSAB=242.3333이 나오고 SSA=41.4444가 나오며 SSB=129.1667이 나온다. 마지막으로 SSA×B는 따로 계산하지 않아도 SSAB-SSA-SSB를 하면 되기에 SSA×B=71.7222가 나오고, 그다음 SSE도 따로 계산하지 않아도 SST-SSA-SSB-SSA×B를 하면 되기에 SSE=234.6667이 나온다.
또 자유도에서 a는 첫 번째 요인의 집단 수를 나타내고, b는 두 번째 요인의 집단 수를 나타내며, r은 두 요인의 각 집단이 서로 만나는 곳의 표본 수(반복한 횟수)를 나타내므로, 요인자유도(A)는 3이고 요인자유도(B)는 2이다. 그리고 상호자유도는 6이며 총자유도는 35이다. 그리고 위의 제곱합과 마찬가지로, “총자유도-요인자유도(A)-요인자유도(B)-상호자유도”를 하면, 오차자유도는 24가 나온다. 또 평균제곱은 “제곱합/자유도”로 구하면 되는데, “요인제곱합(A)/요인자유도(A)”를 하면 MSA=13.8148이 나오고, “요인제곱합(B)/요인자유도(B)”를 하면 MSB=64.5834가 나온다. 그리고 “상호제곱합/상호자유도”를 하면 MSA×B=11.9537이 나오고, “오차제곱합/오차자유도”를 하면 MSE=9.7778이 나온다. 그래서 첫 번째 요인의 F값은 “MSA/MSE”를 해보면 1.41이 나오고, 두 번째 요인의 F값은 “MSB/MSE”를 해보면 6.61이 나온다. 그리고 상호작용의 F값은 “MSA×B/MSE”를 해보면 1.22가 나온다.
그런데 F값이 3개이므로 기각역도 3개를 구해야 하는데, 먼저 첫 번째 요인의 기각역을 구해보면, 유의수준 α=0.05이고 자유도는 (3, 24)이므로,(각각 “요인자유도(A)”와 “오차자유도”이다) 해당하는 값을 F분포표(표)에서 찾으면 첫 번째 요인의 기각역은 3.01이 나온다. 그럼 첫 번째 요인의 검정통계량은 “채택역”안에 위치하므로, 첫 번째 가설에서는 귀무가설이 채택된다. 그래서 첫 번째 요인의 집단들은 평균이 모두 같으므로 “기계”에 따른 제품의 생산량에는 차이가 없다는 것을 알 수 있다.
또 두 번째 요인의 기각역을 구해보면, 유의수준 α=0.05이고 자유도는 (2, 24)이므로,(각각 “요인자유도(B)”와 “오차자유도”이다) 해당하는 값을 F분포표에서 찾으면 두 번째 요인의 기각역은 3.40이 나온다. 그럼 두 번째 요인의 검정통계량은 “기각역”안에 위치하므로, 두 번째 가설에서는 귀무가설이 기각(탈락)된다. 그래서 두 번째 요인의 집단 중 적어도 하나의 평균은 다르므로 “작업자”에 따른 제품의 생산량에는 차이가 있다는 것을 알 수 있다.
마지막으로 상호작용의 기각역을 구해보면, 유의수준 α=0.05이고 자유도는 (6, 24)이므로,(각각 “상호자유도”와 “오차자유도”이다) 해당하는 값을 F분포표에서 찾으면 상호작용의 기각역은 2.51이 나온다. 그럼 상호작용의 검정통계량은 “채택역”안에 위치하므로, 세 번째 가설에서는 귀무가설이 채택된다. 그래서 두 요인 사이에 상호작용이 없다는 것을 알 수 있다.
'통계' 카테고리의 다른 글
상관계수 문제풀이 (1) | 2019.12.17 |
---|---|
상관계수 구하는 법 (2) | 2019.12.16 |
상관계수란? (1) | 2019.12.15 |
상관분석이란? (0) | 2019.12.14 |
이원배치법 구하는 법(반복이 있는 경우) (1) | 2019.12.12 |
이원배치법 문제풀이(반복이 없는 경우) (0) | 2019.12.11 |
이원배치법 구하는 법(반복이 없는 경우) (0) | 2019.12.10 |
일원배치법 문제풀이(반복이 다른 경우) (0) | 2019.12.09 |