본문 바로가기

통계

정규분포 그래프의 특징

정규분포는 통계에서 가장 중요하고 가장 많이 사용하는 확률분포인데, 많은 경영 · 경제 · 사회 · 자연 현상들이 정규분포 형태를 띠고 있기 때문이다. 그래서 통계에서는 정규분포를 가장 많이 사용하는데, 정규분포의 그래프를 한 번 살펴보면, 확률값이 가운데 있는 평균 근처에 많이 분포하고, 평균에서 멀어질수록 적게 분포하기에, 그래프는 종 모양을 하고 있다는 것을 알 수 있다.

이렇게 정규분포는 평균 근처에 확률값이 많이 분포하는데, 예를 들어 한국 성인 남자의 평균 키가 173cm라고 해보자. 그럼 평균 키가 173cm라는 것은, 곧 키가 평균 173cm에서 크게 벗어나지 않은 사람들이 많고, 상대적으로 크게 벗어난 150cm대 혹은 190cm대의 사람들은 별로 없다는 소리다. 그래서 정규분포의 그래프를 3등분해보면, 평균 근처의 비율은 68% 정도가 된다.



그리고 정규분포는 발생할 수 있는 모든 현상을 다루기 때문에, 최댓값과 최솟값이 있다기보다는 무한대()영역을 다룬다. 물론 현실적으로 의 값이 생기는 경우는 거의 없지만, 가끔가다가 극단적으로 치우친 값이 나오는 경우도 있고, 애초에 발생할 수 있는 모든 현상을 다루기 위해서 ±영역으로 설정되어있다. 그래서 정규분포의 그래프는 곡선과 x축이 서로 떨어져 있다는 특징이 있는데, 그래프의 곡선과 x축이 서로 붙어 있으면 최댓값과 최솟값이 생겨서, 영역을 다룰 수 없기 때문이다.


 

그리고 정규분포 같은 연속확률분포는 그래프의 면적으로 확률을 구하는데, 통계에서 확률의 최댓값은 100%이므로, 어떠한 실험이나 사건에서 발생하는 확률의 총합도 100%이다.(참고) 그래서 그래프의 총면적은 확률 100%이다. 그리고 정규분포의 그래프는 좌우대칭인데, 평균을 중심으로 그래프를 반으로 접으면 서로 정확하게 겹친다. 그래서 총면적의 절반은 확률 50%이다.


 

이렇게 정규분포는 그래프의 면적이 곧 확률인데, 그래프의 면적을 구하기 위해서는, 먼저 해당 면적에 해당하는 x축 좌표를 알아야 한다. 그래서 x축 좌표를 기준으로 해당 면적에 해당하는 각각의 확률을 구하는데, 몇 가지 예를 들어보면 아래와 같다. 참고로 정규분포에서는 그래프의 x축 좌표를 보통 Z이라고 부르는데, 다음 글에서는 Z값을 구하는 표준화에 대해서 알아보자.


'통계' 카테고리의 다른 글

이항분포의 정규근사  (1) 2019.11.01
정규분포 문제풀이  (0) 2019.10.31
표준정규분포표로 확률 구하는 법  (0) 2019.10.31
정규분포 표준화하는 법  (0) 2019.10.30
지수분포 문제풀이  (1) 2019.10.29
지수분포의 확률 구하는 법  (2) 2019.10.29
균등분포 문제풀이  (0) 2019.10.28
균등분포의 확률 구하는 법  (0) 2019.10.27