본문 바로가기

통계

분산과 표준편차 구하는 법

통계에서 분산과 표준편차를 구할 때는 먼저 분산을 구한 다음, 분산에 루트를 씌워서 표준편차를 구한다. 그래서 데이터가 주어지면 먼저 분산을 구해야 하는데, 예를 들어 어떠한 실험에서 데이터가 71, 68, 67, 74가 나왔다고 해보자. 그럼 일단 데이터의 평균을 구해보면 70이 나오는 것을 알 수 있다.

그다음 평균을 기준으로 각 데이터의 편차를 구해보면 아래와 같이 나오는데, 편차들을 제곱한 다음 편차 제곱의 평균을 구해보면 7.5가 나온다.(참고로 편차의 합은 항상 0이 나온다. 1-2-3+4=0)



그럼 7.5라는 편차 제곱의 평균이 바로 분산이다. 그래서 분산 구하는 공식을 자세히 살펴보면, 이러한 상황을 알 수가 있는데, 분산을 공식으로 나타내면 아래와 같다.


 

그런데 분산은 제곱된 값이기 때문에, 실질적인 치우침에 비해 그 값이 크다. 그래서 루트를 사용하여 값을 조절하는데, 이 루트를 사용하여 조절된 값이 표준편차. 그래서 표준편차를 루트분산이라고 부르기도 한다. 어쨌든 이렇게 데이터가 주어지면, 데이터의 편차를 계산해서 분산을 구한 다음, 분산에 루트를 씌워서 표준편차를 구한다.


 

참고로 분산은 모집단과 표본일 때에 따라서 2종류로 나뉘는데, 보통 모집단의 분산을 모분산이라고 부르고, 표본의 분산을 표본분산이라고 부른다.(표준편차도 모표준편차표본표준편차로 나뉜다) 그런데 모분산과 표본분산의 공식은 약간 다른데, 공식은 아래와 같다.(표본분산은 n-1로 나눈다)



'통계' 카테고리의 다른 글

이산확률분포와 연속확률분포의 차이  (0) 2019.10.21
확률분포란?  (0) 2019.10.20
표본분산을 n-1로 나누는 이유  (1) 2019.10.20
분산과 표준편차 문제풀이  (1) 2019.10.19
분산을 구할 때 제곱하는 이유  (2) 2019.10.18
분산과 표준편차란?  (2) 2019.10.17
모집단과 표본이란?  (0) 2019.10.16
확률의 범위 문제풀이  (0) 2019.10.16