본문 바로가기

통계

일원배치법 구하는 법

분산분석은 “3개 이상의 모집단 평균이 서로 같은지를 비교하는 분석인데, 분산분석으로 여러 실험을 할 때, 평균에 영향을 주는 요소를 보통 요인(要因: 구할 요, 인할 인)이라고 부른다.(또는 인자라고도 부른다) 그런데 이 요인의 개수에 따라서 분산분석은 크게 3가지로 분류할 수 있다.(이 블로그에서는 이원배치법까지만 다루려고 한다)

그래서 요인이 1개인 경우에는 일원배치법을 사용하고, 요인이 2개인 경우에는 이원배치법을 사용하는데, 예를 들어 제품의 생산량을 파악하기 위해서 총 4대의 기계를 조사한다고 해보자. 그럼 총 4대의 기계를 조사하기 때문에, 집단이 4개가 되기는 하지만, 평균에 영향을 주는 요인은 기계하나뿐이기 때문에, 이 실험은 일원배치법을 사용한다. 다음으로 제품의 생산량을 파악하기 위해서 총 3대의 기계와 총 5명의 작업자를 조사한다고 해보자. 그럼 각 집단의 수는 상관없이, 평균에 영향을 주는 요인은 기계작업자이렇게 둘이기 때문에, 이 실험은 이원배치법을 사용한다.

 


그래서 일원배치법은 평균에 영향을 주는 요인이 1개일 때 사용하는 분산분석법인데, 분산분석의 가장 기본적인 방법이다. 그리고 일원배치법을 사용할 때는, 가장 먼저 귀무가설과 대립가설을 세우는데, 이때 집단의 수를 맞춰줘야 한다. 예를 들어 제품의 생산량을 파악하기 위해서 총 3대의 기계를 조사한다고 하면, 집단이 3개이기 때문에, 가설은 μ3까지 표현해줘야 한다. 그리고 제품의 생산량을 파악하기 위해서 총 4대의 기계를 조사한다고 하면, 집단이 4개이기 때문에, 가설은 μ4까지 표현해줘야 한다.

 


또 분산분석에서는 여러 가지 계산을 많이 하는데, 계산해야 할 것이 많기 때문에, 그냥 무분별하게 계산한다면 굉장히 헷갈릴 수가 있다. 그래서 분산분석표를 작성한 다음, 분산분석표를 기준으로 삼아서 계산하는데, 일원배치법의 분산분석표는 아래와 같다.

 


그럼 분산분석표의 가운데에 있는 값들을 다 구해줘야 하는데, 먼저 제곱합인 SSASSESST를 구해줘야 한다. 자세한 계산은 문제풀이에서 다루겠지만, 일단 집단 간에 발생하는 치우침을 요인제곱합(SSA)이라고 하고, 집단 내에서 여러 개의 표본을 뽑았을 때, 표본 간에 발생하는 치우침을 오차제곱합(SSE)이라고 한다. 마지막으로 모든 치우침을 합쳐서 총제곱합(SST)이라고 한다.

 


또 분산분석표를 보면 자유도가 나오는데, 자유도에서 a는 집단의 개수를 나타내고, r은 각 집단의 표본 수를 나타낸다. 다음으로 평균제곱은 분산이랑 비스무리한 개념으로 제곱합/자유도로 구하면 되는데, 기호는 보통 MS로 표기한다. 마지막으로 “FMSA/MSE로 구하면 되는데, F값이 F분포의 x축 좌표에 해당하는 값이다. 참고로 일원배치법은 크게 반복이 같은 경우반복이 다른 경우로 나뉘는데, 이 반복이란 각 집단의 표본 수를 나타내는 말이다. 그림으로 나타내면 아래와 같다.(집단은 보통 A라고 표기한다)