정규분포의 그래프는 기본적으로 “종 모양”을 하고 있지만, 표준편차인 σ의 크기가 커지거나 작아짐에 따라서 그래프의 모양이 변한다. 그래서 σ의 크기가 커질수록 그래프의 모양은 점점 옆으로 퍼지고,(σ=2일 때만 해도 그래프는 옆으로 많이 퍼진다) 반대로 σ의 크기가 작아질수록 그래프의 모양은 점점 위로 뾰족해진다.(σ=0.5일 때만 해도 그래프는 위로 많이 뾰족해진다)
그런데 통계에서는 무수히 많은 실험을 하는데, 매 실험마다 표준편차의 값은 제각각이라서, 해당 실험에 따라 정규분포의 모양도 계속 변한다. 그런데 그래프의 모양이 변할 때마다, 해당 곡선의 함수를 파악해서 그래프의 면적을 일일이 계산하는 것은 굉장히 힘들고 귀찮은 짓이다. 그래서 이러한 불편을 줄이고자 표준이 되는 기준을 만들었는데, 그것이 바로 “표준”정규분포이다.(표준화된 정규분포로 평균 μ=0이고 표준편차 σ=1인데, σ를 1로 정한 이유는, 숫자 1이 다루기도 편하고 그래프의 모양도 적절하기 때문이다) 그리고 어떠한 실험을 통해서 나온 일반 정규분포를 표준정규분포로 바꾸는 과정을 “표준화”라고 한다.
“표준화”를 하기 위해서는 위에 있는 정규분포 공식을 사용하면 되는데, 실험의 데이터가 공식을 거치면 표준정규분포의 Z값이 된다. 그럼 이 Z값을 그래프의 x축 좌표로 활용해서 해당 구간의 면적을 구하면 된다.(정규분포 공식은 나중에 “신뢰구간”이랑 “가설검정”에서도 사용하는데, 그때는 표본을 뽑아서 계산하기 때문에 공식이 살짝 바뀐다) 추가로 표준화하는 과정을 이해하기 위해서는 직접 문제를 풀어보는 것이 좋기에, 문제 하나를 예로 들어 보자.
1. 우리나라 성인 남자의 키를 조사하였더니, 평균은 173cm 그리고 표준편차는 5cm가 나왔다고 한다. 이때 키가 185cm 이상일 확률을 구하려고 하는데, 해당 상황에 맞는 정규분포 표준화를 하시오.
평균 μ=173이고 표준편차 σ=5이므로, 공식을 사용해서 표준화를 해보면, 평균 173cm의 Z값=0이 나오고(이렇게 표준정규분포의 평균은 항상 0이 나온다) 구하고자 하는 185cm의 Z값=2.4가 나오는데, 아래의 그림이 일반 정규분포를 표준정규분포로 바꾸는 “표준화” 과정이다.(키가 185cm 이상일 확률은, Z값 “2.4 이상일 확률”을 구하면 된다)
참고로 정규분포 공식을 사용해서 Z값을 구하고 나면, Z값에 해당하는 구간의 면적을 구해야 하는데, 해당 면적의 넓이를 매번 손수 계산하기란 매우 힘들고 불편하다. 그래서 여러 Z값에 해당하는 면적의 넓이를 정리해 놓은 표준정규분포표를 사용하는데, 다음 글에서는 표준정규분포표에 대해서 알아보자.
'통계' 카테고리의 다른 글
t분포란? (1) | 2019.11.01 |
---|---|
이항분포의 정규근사 (1) | 2019.11.01 |
정규분포 문제풀이 (0) | 2019.10.31 |
표준정규분포표로 확률 구하는 법 (0) | 2019.10.31 |
정규분포 그래프의 특징 (0) | 2019.10.30 |
지수분포 문제풀이 (1) | 2019.10.29 |
지수분포의 확률 구하는 법 (2) | 2019.10.29 |
균등분포 문제풀이 (0) | 2019.10.28 |