표본분산을 n-1로 나누는 이유
2019. 10. 20.
통계에서 표본분산을 구할 때 n-1로 나누는데, 그 이유는 그냥 n-1로 나누는 것이 값의 정확도가 더 높기 때문이다. 단지 추측이기는 하지만 통계학이 발달하기 이전에는 표본분산도 n으로 나눴을 것이다. 하지만 n으로 나눴을 때만 하더라도 표본분산의 정확도는 그렇게 높지가 않아서, 값의 정확도를 올리기 위하여 여러 가지 연구를 했을 것이다.그러던 와중에 추정량에 대한 연구를 하다가, 수식적으로 표본분산의 기댓값을 구할 때, n-1로 나눠보니 σ2이 나온다는 것을 증명하였다.(수식의 전개과정을 완벽하게 이해하기 위해서는, 마지막 부분에서 추가적으로 “추정량”에 대한 이해가 필요하다. 하지만 이 블로그에서는 “추정량”에 대해서는 다루지 않을 생각이라서, 해당 부분은 다른 통계 책을 참고하기 바람) 그래서 한..