본문 바로가기

통계

모집단과 표본이란?

통계는 사회의 여러 현상을 조사하고 파악할 때 많이 활용되는데, 여러 현상을 조사하기 위해서는 먼저 모집단과 표본에 대해서 알아야 한다. 일단 예를 들어 전국 고등학생 수가 150만 명 정도라고 할 때, 전국 고등학생들의 학업 만족도를 조사한다고 해보자. 그런데 150만 명을 다 조사하는 게 가능할까? 물론 가능은 하겠지만, 150만 명을 다 조사하기에는 시간과 비용이 너무 많이 든다. 그래서 현실에서는 일부 몇 명만 뽑아서 학업 만족도를 조사한다.

또 다른 예를 들어 어떤 방위산업체에서 폭탄 100만 개 만들었다고 해보자. 그런데 이 중에는 불량으로 터지지 않는 폭탄도 있을 것이다. 그래서 불량률을 조사해야 하는데, 불량률을 조사하기 위해서는 실제로 폭탄을 터뜨려야만 한다면, 100만 개를 다 터뜨려야 할까? 폭탄은 한 번 터지면 다시는 사용할 수가 없다. 불량률을 체크하기 위해서 다 터뜨려야 한다면, 굳이 만들 이유도 없다. 그래서 100만 개 중에서 일부 몇 개만 뽑아서 불량률을 파악한다.

 


이렇게 폭탄처럼 한 번 조사하고 나면 다시는 사용할 수 없는, 즉 상품 가치를 잃어버리는 경우와 꼭 그런 이유가 아니더라도 현실에서는 시간과 비용의 제약으로 무엇인가를 조사할 때, 전체를 다 조사하지 않고 일부 몇 개만 뽑아서 조사하는 경우가 대부분이다. 이때 조사하기 위해서 뽑은 몇 개의 샘플을 표본이라고 부르고, 전국 고등학생 수 150만 명 그리고 폭탄 100만 개처럼 조사하고자 하는 대상 전체를 모집단이라고 부른다.



그리고 표본은 모집단에서 일부만 뽑아서 조사하는 것이기 때문에, 샘플로 뽑은 표본의 양(n)이 많으면 많을수록, 데이터의 신뢰도는 올라간다. 또 모집단의 특성을 나타낸 수치를 모수라고 부르고, 표본의 특성을 나타낸 수치를 통계량이라고 부르는데, 서로 기호가 다르다. 그래서 처음에는 조금 헷갈릴 수가 있는데, 기호를 표로 정리하면 한결 구별하기가 편해진다. 참고로 통계에서는 보통 평균” “표준편차” “분산을 많이 사용하는데, 아래에 있는 빨간 글씨는 기호를 읽는 방법이다.



'통계' 카테고리의 다른 글

분산과 표준편차 문제풀이  (1) 2019.10.19
분산과 표준편차 구하는 법  (5) 2019.10.19
분산을 구할 때 제곱하는 이유  (2) 2019.10.18
분산과 표준편차란?  (2) 2019.10.17
확률의 범위 문제풀이  (0) 2019.10.16
확률의 범위  (0) 2019.10.15
확률 구하는 문제풀이  (1) 2019.10.15
확률이란?  (0) 2019.10.15