본문 바로가기

통계

확률분포란?

사람들은 평소에 많은 정보를 서로 주고받는다. 그런데 사람이 정보를 받아들일 때, 어떠한 경우에는 숫자보다 이미지가 더 편한 경우가 많다. 그래서 수학에서는 보다 쉽게 정보를 전달하기 위해서 표와 그래프 같은 이미지를 사용하는데, 예를 들어 주사위 2개를 던져서 나올 수 있는 모든 눈금의 합의 확률을 구해서, 표와 그래프로 나타내보자. 그러면 확률값을 단순히 숫자로만 나타냈을 때보다는, 확률값의 특성을 파악하기가 훨씬 편해진다.




그런데 위의 표와 그래프를 한 번 살펴보면, 확률값이 불규칙하게 산발적으로 퍼져있는 것이 아니라, 일정한 형태로 퍼져있다는 것을 알 수 있는데, 이렇게 일정한 형태로 확률값이 퍼져있는 것을 확률분포라고 한다. 그런데 어떠한 실험을 했는지에 따라서, 확률값이 퍼져있는 모양은 제각각이다. 그래서 어떠한 경우에는 확률값이 모양으로 퍼져있고, 또 어떠한 경우에는 확률값이 모양으로 퍼져있을 수도 있다.



그런데 확률값이 일정한 형태로 퍼져 있으면, 퍼져있는 모양을 활용해서 공식을 만들 수 있는데, 한 번 모양과 모양에 알맞은 공식을 만들어보자. 그럼 공식을 활용하면 확률 구하는 것이 훨씬 편해진다. 왜냐하면 어떤 실험을 했는데, 확률값이 모양으로 퍼져있다면, 굳이 일일이 데이터를 분석해서 확률을 구하지 않아도, 모양의 공식을 활용하면 바로 확률을 구할 수 있다. 마찬가지로 실험을 했는데, 확률값이 모양으로 퍼져있다면, 기존에 구해놓은 모양의 공식을 활용해서 확률을 구하면 된다.(참고로 아래의 공식은 그냥 이차함수일차함수의 공식으로, 간단한 설명을 위해서 예로 든 것뿐이다. 통계에서 사용하는 여러 확률분포의 공식은 아래에 있는 공식과는 만드는 과정이 다르다)


 

이렇게 통계에서 확률분포가 중요한 이유는 바로 공식 때문이다. 왜냐하면 현실에서는 통계를 활용해서 무수히 많은 실험과 분석을 하는데, 매 실험마다 일일이 데이터를 분석해서 확률을 구하는 것은 굉장히 힘들고 귀찮은 짓이다. 하지만 먼저 확률값이 퍼져있는 형태를 활용해서 여러 공식을 미리 만들어 놓으면, 그다음부터는 공식을 활용해서 훨씬 쉽고 간편하게 확률을 구할 수 있다. 그래서 통계에는 많은 확률분포가 있는데, 각 분포마다 공식이 하나씩 있다. 그리고 확률분포는 크게 이산확률분포와 연속확률분포로 나뉜다.