본문 바로가기

통계

분산과 표준편차란?

우리가 사는 세상은 항상 변하기에, 정답이라고 생각했던 것들도 어김없이 변한다. 그리고 변하는 과정에서 오차가 발생하는데, 사람들은 이러한 상황에 대비하기 위하여 오차를 예측하기 시작한다. 그럼 오차란 무엇일까? 다양하게 정의 내릴 수 있겠지만, 굳이 하나를 말하자면 치우침이라고 할 수 있다. 그런데 통계는 이러한 치우침을 분석하고 관리하는 역할도 하는데, 통계에서 치우침을 나타내는 대표적인 척도가 분산과 표준편차다.

예를 들어 통계에서 여러 실험을 해보면, 데이터가 제각각으로 흩어져 있어서 치우침이 발생한다는 것을 알 수 있다. 그런데 어떠한 실험을 했는지에 따라서데이터가 흩어져 있는 치우침이 작은 경우도 있는 반면, 데이터가 흩어져 있는 치우침이 큰 경우도 있다. 그래서 각각의 치우침이 어느 정도인지를 알아야 하고, 그로 인해 서로 얼마나 다른지도 파악할 수 있어야 하는데, 아래에 있는 그림만으로 이것을 파악하기에는 한계가 있다.



그래서 통계에서는 추가로 숫자를 활용해서 치우침을 나타내는데, 데이터가 흩어져 있는 치우침의 정도를 숫자로 나타낸 것이 바로 분산과 표준편차다. 어쨌든 숫자를 활용하면 치우침의 정도를 파악하기가 편해지는데, 그냥 숫자의 크기가 작을수록 치우침은 작다는 뜻이고, 숫자의 크기가 클수록 치우침은 크다는 뜻이다.(분산과 표준편차가 0에 가까울수록, 데이터가 흩어져 있는 치우침은 작다고 볼 수 있다)


 

그런데 얼마나 흩어져 있는지를 알기 위해서는, 기준이 되는 기준점이 필요한데, 보통 기준점으로 평균을 많이 사용한다. 그래서 평균을 기준으로 각 데이터의 치우침을 파악한다.



'통계' 카테고리의 다른 글

표본분산을 n-1로 나누는 이유  (1) 2019.10.20
분산과 표준편차 문제풀이  (1) 2019.10.19
분산과 표준편차 구하는 법  (5) 2019.10.19
분산을 구할 때 제곱하는 이유  (2) 2019.10.18
모집단과 표본이란?  (0) 2019.10.16
확률의 범위 문제풀이  (0) 2019.10.16
확률의 범위  (0) 2019.10.15
확률 구하는 문제풀이  (1) 2019.10.15