일원배치법은 크게 “반복이 같은 경우”와 “반복이 다른 경우”로 나뉘는데, 이번에는 반복이 다른 경우에 대해서 알아보자. 사실 분산분석에서 표본을 뽑을 때, 웬만하면 표본의 수를 동일하게 뽑는 경우가 대부분이기는 하지만, 가끔가다가 표본의 수가 다른 경우도 있다. 그래서 반복이 다른 경우도 알아둘 필요는 있는데, 반복이 다른 경우의 분산분석표는 아래와 같다.
그럼 이전 글에서 알아보았던 “반복이 같은 경우”와 비교해보면, 자유도가 서로 다르다는 것을 알 수 있다. 그래서 a는 집단의 개수를 나타내고 n은 전체 표본 수를 나타내므로, 요인자유도는 a-1이고 총자유도는 n-1이다. 그리고 “총자유도-요인자유도=오차자유도”이므로, 오차자유도는 (n-1)-(a-1)=n-a가 된다.(참고로 SSA의 계산하는 방법도 살짝 달라지는데, 그건 문제에서 알아보자)
1. 어느 제조업 회사에서 광고의 종류에 따라 제품의 판매량이 어떻게 증가하는지를 알아보려고 한다. 그래서 “신문광고” “인터넷 광고” “라디오 광고”를 통한 제품의 판매 증가량을 파악한 결과 다음과 같았다. 그럼 광고의 종류에 따라 제품의 판매 증가량에 차이가 있는지를 유의수준 10%에서 검정하시오.
분산분석은 “평균이 서로 같은지를 비교하는 분석”이므로, 귀무가설은 “세 집단의 평균이 모두 같다”로 설정하고,(집단이 3개이므로, 가설에서 μ3까지만 표현한다) 대립가설은 “적어도 하나의 평균은 다르다”로 설정한다. 참고로 평균이 같다는 것은 곧 “판매 증가량”도 같다는 소리다. 그래서 귀무가설은 “판매 증가량에 차이가 없다”는 뜻이고, 대립가설은 “판매 증가량에 차이가 있다”는 뜻이다.
다음으로 검정통계량인 F값을 구해야 하는데, 제곱합을 계산할 때는 공식2를 사용한다고 했었다.(참고) 그래서 일단 각 표본의 합계를 구한 후, “수정항 → SST → SSA → SSE” 순으로 구하면 되는데, 먼저 수정항 CT=5544.045가 나오고, SST=533.225가 나온다. 다음으로 SSA 구하는 법은 이전 글에서 알아보았던 “반복이 같은 경우”와 살짝 다른데, 집단마다 표본의 수가 서로 다르므로, 표본의 수에 맞춰서 따로따로 나눠주면 된다. 그래서 SSA=164.33이 나온다. 마지막으로 SSE는 따로 계산하지 않아도 SST-SSA를 하면 되기에, SSE=368.895가 나온다.
그리고 자유도에서 a는 집단의 개수를 나타내고 n은 전체 표본 수를 나타내므로, 요인자유도는 2이고 총자유도는 17이다. 그리고 위의 제곱합과 마찬가지로 “총자유도-요인자유도”를 하면, 오차자유도는 15가 나온다. 또 평균제곱은 “제곱합/자유도”로 구하면 되는데, “요인제곱합/요인자유도”를 하면 MSA=82.165가 나오고, “오차제곱합/오차자유도”를 하면 MSE=24.593이 나온다. 마지막으로 검정통계량인 F값은 “MSA/MSE”를 해보면 3.34가 나온다.
그리고 기각역을 구해보면, 유의수준 α=0.1이고 자유도는 (2, 15)이므로,(각각 “요인자유도”와 “오차자유도”이다) 해당하는 값을 F분포표(표)에서 찾으면 기각역은 2.70이 나온다. 그럼 검정통계량이 “기각역”안에 위치하므로 귀무가설이 기각(탈락)된다. 그래서 세 집단 중 적어도 하나의 평균은 다르므로 광고의 종류에 따라 제품의 판매 증가량에는 차이가 있다는 것을 알 수 있다.
'통계' 카테고리의 다른 글
이원배치법 문제풀이(반복이 있는 경우) (1) | 2019.12.13 |
---|---|
이원배치법 구하는 법(반복이 있는 경우) (1) | 2019.12.12 |
이원배치법 문제풀이(반복이 없는 경우) (0) | 2019.12.11 |
이원배치법 구하는 법(반복이 없는 경우) (0) | 2019.12.10 |
일원배치법 문제풀이(반복이 같은 경우) (0) | 2019.12.08 |
일원배치법 구하는 법 (0) | 2019.12.07 |
분산분석에서 분산 구하는 공식 (2) | 2019.12.06 |
분산분석과 가설검정의 귀무가설과 대립가설의 차이 (0) | 2019.12.05 |