F분포도 t분포 그리고 카이제곱분포와 마찬가지로 직접 확률을 구할 때 사용하는 분포가 아니라, 나중에 신뢰구간과 가설검정 그리고 분산분석에서 사용하는 분포다. 그리고 이러한 분석을 하려면 F값을 알아야 하는데, F값은 아래에 있는 F분포표를 사용해서 구한다. 그래서 F분포표는 F값을 중심으로 표가 구성되어 있는데, 클릭하면 그림이 커진다.
그럼 “표” 보는 법을 알아보자. 일단 F분포는 카이제곱분포와 마찬가지로 “분산”을 다룰 때 사용하는 분포인데, 카이제곱분포와는 달리 두 집단의 분산을 다룬다. 그래서 자유도가 2개 있는데, 표의 x축은 분자의 자유도(n1-1)를 다루고 있고, y축은 분모의 자유도(n2-1)를 다루고 있다. 그리고 확률 α는 그래프의 오른쪽 면적에 해당한다.
그런데 두 개의 집단 중에서, 어느 것이 분자이고 어느 것이 분모인지 헷갈릴 수 있는데, F분포는 보통 분산이 더 큰 집단을 분자에 놓고, 상대적으로 분산이 작은 집단을 분모에 놓는다.
그리고 이렇게 하는 이유는 바로 그래프의 오른쪽 면적을 사용하기 위해서이다. F분포는 숫자 1을 기준으로 왼쪽 면적과 오른쪽 면적으로 나눌 수 있는데, 왼쪽 면적은 “1보다 작은 수”이고, 오른쪽 면적은 “1보다 큰 수”이다. 그럼 오른쪽 면적을 사용하기 위해서는 F통계량(가설검정과 분산분석에서 사용하는 통계량)이 1보다 크게 나와야 하는데, 분산이 더 큰 집단을 분자에 놓으면 1보다 큰 값이 나온다. 그래서 보통 분산이 더 큰 집단을 분자에 놓는다.(꼭 이렇게 해야 하는 것은 아니지만, 이렇게 하는 게 여러모로 편하다)
그리고 이렇게 오른쪽 면적에 집착하는 이유는 F분포표를 분석해보면 알 수 있는데, F분포표의 가장 작은 값은 항상 1이다. 즉 “1보다 작은 수”로 구할 수 있는 왼쪽 면적은 아예 다루지도 않는다. 그래서 F분포는 왼쪽 면적보다 오른쪽 면적이 사용하기에 훨씬 편하다.(가끔가다가 왼쪽 면적을 사용하는 경우도 있지만, 그런 경우는 그렇게 많지가 않다) 또 F분포는 나중에 분산분석에서 많이 사용하는데, 분산분석에서는 그래프의 오른쪽 면적을 주로 사용할 뿐, 왼쪽 면적은 잘 사용하지 않는다.
그런데 F분포가 오른쪽 면적만 사용하는 것은 아니다. 가끔가다가 왼쪽 면적도 사용하기에, 왼쪽 F값 구하는 법도 알아야 하는데, 일단 F분포가 카이제곱분포와 모양이 비슷하기에, 카이제곱분포처럼 1-α로 구하면 될 것 같지만, 표의 특성상 1-α로는 왼쪽 F값을 구할 수 없다. 왜냐하면 카이제곱분포표는 큰 확률도 다루기에 1-α로 왼쪽 χ2값을 구할 수 있었지만, F분포표는 작은 확률만 다루기에 1-α로는 왼쪽 F값을 구하지 못한다.(F분포에서 1-α는 그냥 생각하지 않는 게 더 편하다. 오히려 이것 때문에 더 헷갈릴 수 있다)
그래서 왼쪽 F값은 1-α로 구하는 것이 아니라 “역수”를 취해서 구하는데, 한 가지 주의해야 할 것은 분자와 분모의 자유도가 서로 바뀐다. 그래서 이점을 주의해야 하는데, 왼쪽 F값은 아래와 같다.
그리고 신뢰구간과 가설검정에서 한 번에 양쪽 F값을 구하는 경우도 있는데, 이런 경우에는 α가 그래프의 양쪽으로 나뉘기 때문에 α/2를 해줘야 한다. 그래서 양쪽 F값은 아래와 같은데, 몇 가지 문제를 통해서 F값을 한 번 구해보자.
1. 두 집단 A와 B가 있는데, 집단 A의 표본분산은 20이고 n=9라고 한다. 그리고 집단 B의 표본분산 30이며 n=6이라고 한다. 이때 α=0.1에 해당하는 F값을 구하시오.
먼저 집단 B의 분산이 더 크므로, 집단 B가 분자가 되고, 집단 A가 분모가 된다. 그래서 n1-1=5이고 n2-1=8이다. 그럼 α=0.1에 해당하는 F값을 표에서 찾으면 2.73이 나온다.
2. 집단 A의 표본분산은 23이고 n=10이라고 한다. 그다음 집단 B의 표본분산은 15이고 n=7이라고 한다. 그럼 이때 α=0.025에 해당하는 왼쪽 F값을 구하시오.
집단 A의 분산이 더 크므로, 집단 A가 분자이고 집단 B가 분모이다. 그래서 n1-1=9이고 n2-1=6인데, 왼쪽 F값을 구하는 것이므로 분자와 분모의 자유도가 서로 바뀐다. 그럼 α=0.025이므로 해당하는 값을 표에서 찾으면 4.32가 나오는데, 1/F를 해야 하므로 왼쪽 F값은 1/4.32=0.23이 나온다.(참고로 이렇게 왼쪽 F값만 구하는 경우는 거의 없다)
3. 집단 A의 표본분산은 60이고 n=10이라고 한다. 또 집단 B의 표본분산은 40이고 n=6이라고 한다. 이때 α=0.1에 해당하는 양쪽 F값을 구하시오.
일단 양쪽 F값이므로 α/2=0.05이다. 그리고 집단 A의 분산이 더 크므로, n1-1=9이고 n2-1=5이다. 그래서 일단 해당하는 값을 표에서 찾으면 오른쪽 F값은 4.77이 나온다. 그리고 왼쪽 값은 자유도가 서로 바뀌므로 3.48이 나오는데, 추가로 1/F를 해보면 왼쪽 F값은 1/3.48=0.29가 나온다.
'통계' 카테고리의 다른 글
90%, 95%, 99% 신뢰구간의 차이 (0) | 2019.11.07 |
---|---|
신뢰구간이란? (0) | 2019.11.06 |
점추정과 구간추정이란? (0) | 2019.11.06 |
통계적 추정이란? (1) | 2019.11.06 |
F분포란? (0) | 2019.11.04 |
카이제곱분포표 보는 법 (3) | 2019.11.04 |
카이제곱분포란? (3) | 2019.11.03 |
t분포표 보는 법 (0) | 2019.11.02 |