본문 바로가기

기초 의학 통계

2. 표본 추출

반응형

확률 표본 추출

 

확률 표본 추출법은 모집단에서 표본으로 추출될 확률을 알 수 있는 추출 방법입니다. 예를 들어 100명의 모집단에서 10명을 무작위로 표본을 추출한다면 표본으로 수집될 확률은 10/100입니다. 확률표본추출을 하기 위해서는 표집틀이 필요합니다. 표집틀이란 표본으로 추출할 대상이 있는 명부 혹은 목록을 뜻합니다. 선거등록명부, 의료보험공단 목록 등이 표집틀에 해당합니다. 확률 표본 추출은 모집단을 대표할 수 있는 표본을 얻을 수 있습니다. 확률 표본 추출법은 아래 4가지의 방법이 있습니다. 

 

단순확률추출(simple random sampling)

 

크기가 N인 모집단에서 크기가 n인 표본을 무작위로 추출하는 방법입니다. 모든 개체들이 표본에 선택될 확률이 n/N으로 동일합니다. 

 

계통표본추출(systemic sampling)

 

모집단 목록에서 매 k번째 사례를 표본으로 추출하는 방법입니다. 예를 들어 선거출구조사를 할 때, 매 3번째 나오는 사람들을 표본으로 추출하는 방법입니다. 그러면 3, 6, 9, 12...... 번째 나오는 사람들이 표본으로 추출됩니다. 표집틀이 없어 고유번호 부여, 난수 발생 등 단순확률추출법을 적용하기 어려운 실제 조사현장에서 폭넓게 활용됩니다.

 

층화확률추출(stratified randon sampling)

 

모집단을 서로 중복되지 않는 여러 개의 층으로 나누고, 각 층에서 단순확률추출에 의해 표본을 추출하는 방법입니다. 각 층은 성별, 연령, 지역 등으로 구성할 수 있습니다. 예를 들어 선거 사전 투표에서 지역별로 층을 나누어 각 층마다 단순확률추출을 하여 표본을 모집하는 것입니다. 이렇게 층을 나눈 집단을 부모집단( subpopulation)이라고 합니다. 

 

집락표본추출(Cluster sampling)

 

모집단이 전체 모집단을 설명할 수 있는 여러 집락(cluster)으로 구성되어 있을 떄, 집락을 무작위로 선택한 후, 이 군집에서 표본을 추출하는 방법입니다. 예를 들어 서울 시 고등학생들의 사교육비를 조사하고자 한다면, 서울시에 위치하는 고등학교를 집락(cluster)으로 추출하고, 이후 각 고등학교의 학생을 표본으로 추출하는 방법입니다.  

 

비확률 표본 추출

 

모든 대상이 표본으로 선택될 확률이 동일하지 않거나, 확률을 알 수 없는 방법입니다. 표본 오류가 크고 모집단을 대표하기가 어렵다는 단점이 있습니다. 

 

반응형

'기초 의학 통계' 카테고리의 다른 글

4. 자료의 종류와 특성  (0) 2024.05.08
3. 가중치  (0) 2024.05.04
1. 모집단과 표본  (0) 2024.05.02