본문 바로가기

통계

일원배치법 문제풀이(반복이 다른 경우)

일원배치법은 크게 반복이 같은 경우반복이 다른 경우로 나뉘는데, 이번에는 반복이 다른 경우에 대해서 알아보자. 사실 분산분석에서 표본을 뽑을 때, 웬만하면 표본의 수를 동일하게 뽑는 경우가 대부분이기는 하지만, 가끔가다가 표본의 수가 다른 경우도 있다. 그래서 반복이 다른 경우도 알아둘 필요는 있는데, 반복이 다른 경우의 분산분석표는 아래와 같다.

그럼 이전 글에서 알아보았던 반복이 같은 경우와 비교해보면, 자유도가 서로 다르다는 것을 알 수 있다. 그래서 a는 집단의 개수를 나타내고 n은 전체 표본 수를 나타내므로, 요인자유도는 a-1이고 총자유도는 n-1이다. 그리고 총자유도-요인자유도=오차자유도이므로, 오차자유도는 (n-1)-(a-1)=n-a가 된다.(참고로 SSA의 계산하는 방법도 살짝 달라지는데, 그건 문제에서 알아보자)

 

 

 

 

1. 어느 제조업 회사에서 광고의 종류에 따라 제품의 판매량이 어떻게 증가하는지를 알아보려고 한다. 그래서 신문광고” “인터넷 광고” “라디오 광고를 통한 제품의 판매 증가량을 파악한 결과 다음과 같았다. 그럼 광고의 종류에 따라 제품의 판매 증가량에 차이가 있는지를 유의수준 10%에서 검정하시오.

분산분석은 평균이 서로 같은지를 비교하는 분석이므로, 귀무가설은 세 집단의 평균이 모두 같다로 설정하고,(집단이 3개이므로, 가설에서 μ3까지만 표현한다) 대립가설은 적어도 하나의 평균은 다르다로 설정한다. 참고로 평균이 같다는 것은 곧 판매 증가량도 같다는 소리다. 그래서 귀무가설은 판매 증가량에 차이가 없다는 뜻이고, 대립가설은 판매 증가량에 차이가 있다는 뜻이다.

 


다음으로 검정통계량인 F값을 구해야 하는데, 제곱합을 계산할 때는 공식2를 사용한다고 했었다.(참고) 그래서 일단 각 표본의 합계를 구한 후, “수정항 SST SSA SSE” 순으로 구하면 되는데, 먼저 수정항 CT=5544.045가 나오고, SST=533.225가 나온다. 다음으로 SSA 구하는 법은 이전 글에서 알아보았던 반복이 같은 경우와 살짝 다른데, 집단마다 표본의 수가 서로 다르므로, 표본의 수에 맞춰서 따로따로 나눠주면 된다. 그래서 SSA=164.33이 나온다. 마지막으로 SSE는 따로 계산하지 않아도 SST-SSA를 하면 되기에, SSE=368.895가 나온다.

 



그리고 자유도에서 a는 집단의 개수를 나타내고 n은 전체 표본 수를 나타내므로, 요인자유도는 2이고 총자유도는 17이다. 그리고 위의 제곱합과 마찬가지로 총자유도-요인자유도를 하면, 오차자유도는 15가 나온다. 또 평균제곱은 제곱합/자유도로 구하면 되는데, “요인제곱합/요인자유도를 하면 MSA=82.165가 나오고, “오차제곱합/오차자유도를 하면 MSE=24.593이 나온다. 마지막으로 검정통계량인 F값은 “MSA/MSE”를 해보면 3.34가 나온다.

 


그리고 기각역을 구해보면, 유의수준 α=0.1이고 자유도는 (2, 15)이므로,(각각 요인자유도오차자유도이다) 해당하는 값을 F분포표()에서 찾으면 기각역은 2.70이 나온다. 그럼 검정통계량이 기각역안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 세 집단 중 적어도 하나의 평균은 다르므로 광고의 종류에 따라 제품의 판매 증가량에는 차이가 있다는 것을 알 수 있다.