본문 바로가기

통계

대응표본의 신뢰구간 문제풀이

이전 글에서 대응표본의 신뢰구간은 실험 전후의 두 평균이 서로 얼마나 차이 나는지를 추정하는 것이라고 했었는데, 대응표본은 표준편차를 직접 구해야 하므로 문제를 풀기가 조금 번거롭다. 그리고 신뢰구간은 -이 나오면 안 되는데, 대응표본의 신뢰구간은 그 특성상 -값이 자주 나온다. 그래서 대응표본은 가설검정은 많이 다루지만, 신뢰구간은 잘 다루질 않는다.


 

 

1. 요가를 꾸준히 하면 다이어트에 효과가 있는 것으로 알려져 있는데, 요가 전후로 체중이 얼마나 차이 나는지를 파악하려고 한다. 그래서 5명을 뽑아 일정기간 요가를 하게 한 후, 체중의 변화를 조사하였더니 아래와 같이 나왔다고 한다. 그럼 요가 전후에 따른 체중의 차이에 대한 90%의 신뢰구간을 구하시오.

요가 전 체중:        63        65        81        75        73

요가 후 체중:        56        61        76        71        73

신뢰구간을 구하기 위해서는, 우선 차이의 평균차이의 표준편차를 구해야 하는데, 요가 전후 차이의 평균을 구해보면 4가 나오고, 차이의 표준편차를 구해보면 2.5495가 나온다.

 


그리고 90%의 신뢰구간이므로 α/2=0.05이고 자유도는 5-1=4인데, 해당하는 값을 t분포표()에서 찾으면 tα/2±2.132가 나온다. 그럼 공식에 대입해서 90%의 신뢰구간을 구해보면, 요가 전후에 따른 체중의 차이는 1.5692kg에서 6.4308kg 사이라고 추정할 수 있다.

 


 

 

 

2. 어느 한 공장에서 새로운 생산시스템을 도입 하려고 하는데, 그전에 일단 시스템 도입 전후에 따른 생산량이 얼마나 차이 나는지를 알아보려고 한다. 그래서 생산현장의 일부만 먼저 시스템을 도입한 후, 생산량을 조사하였더니 다음과 같이 나왔다고 한다. 그럼 새로운 생산시스템 도입 전후에 따른 생산량의 차이에 대한 95%의 신뢰구간을 구하시오.

도입 전 생산량:        60        70        52        64

도입 후 생산량:        65        72        60        73

일단 차이의 평균차이의 표준편차를 구해보면, 먼저 도입 전후 차이의 평균은 -6이 나오고, 차이의 표준편차는 3.1623이 나온다.

 


그리고 95%의 신뢰구간이므로 α/2=0.025이고 자유도는 5-1=3인데, 해당하는 값을 표에서 찾으면 tα/2±2.776이 나온다. 그래서 95%의 신뢰구간을 구해보면, 새로운 생산시스템 도입 전후에 따른 생산량의 차이는 -11.0312에서 -0.9688 사이라고 추정할 수 있다.

 


그런데 이 문제의 답은 잘못되었다. 왜냐하면 대응표본의 신뢰구간은 두 평균이 서로 얼마나 차이 나는지를 파악하는 것인데, -값은 차이가 없다로 해석되기 때문이다.(참고로 값이 나오는 것을 본 적이 없을 수도 있는데, 그것은 문제를 내는 사람들이 -값이 나오는 상황을 피해서 문제를 내기 때문이다)

 


그래서 신뢰구간은 +값으로만 나타내야 하기에, -값을 +값으로 바꿔줘야 하는데, 그 방법의 하나가 바로 집단의 순서를 바꿔주는 것이다. 그래서 집단의 순서만 바꿔주면 -값이 +값으로 바뀌면서, 새로운 생산시스템 도입 전후에 따른 생산량의 차이는 0.9688에서 11.0312 이라고 추정할 수 있다.(집단의 순서를 바꾸어도 -값이 나오는 경우가 있는데, 이럴 때는 표본의 수를 늘려주면 +값이 나온다) 그런데 ±의 차이만 있을 뿐, 어차피 수치는 동일하므로, 굳이 집단의 순서를 바꾸지 않고 그냥 절댓값만 씌워도 된다.