분산을 구할 때 제곱하는 이유
2019. 10. 18.
통계에서 모집단의 분산은 σ2이라고 나타내고, 표본의 분산은 s2이라고 나타내는데, 둘 다 “제곱”이 붙어 있다는 것을 알 수 있다. 그리고 분산 구하는 공식을 살펴보면, 공식에도 제곱이 붙어있다. 그럼 분산을 구할 때, 왜 제곱을 하는지에 대해서 한 번 알아보자. 일단 이전 글에서 분산은 “치우침을 나타내는 대표적인 척도”라고 했었는데, 수학이라는 언어의 특성상 치우침을 바로 구하기가 조금 애매하다. 예를 들어 평균에서 데이터까지의 거리를 편차(偏差: 치우칠 편, 어긋날 차)라고 해보자. 그럼 데이터가 여러 개 있을 때, 모든 편차들의 합은 얼마일까? 그럼 편차들의 합은 1+2+3+4=10이라는 것을 쉽게 알 수 있다. 그런데 수학적 계산으로는 10이라는 값이 나오지 않는다. 왜냐하면 수학이라는 언어의..