문서의 이전 판입니다!
정의
표본추출(Sampling)은 전체 모집단에서 일부를 선택하여 연구하는 과정으로, 이를 통해 모집단의 특성을 추정한다. 표집과 같은 말이다.
설명
사회 현상을 연구할 때 모든 사례를 조사하는 것은 시간, 비용, 인력 측면에서 현실적으로 어렵다. 예를 들어, 한국 청소년의 스마트폰 사용 시간을 연구한다고 할 때, 모든 청소년을 조사할 수는 없다. 이때 청소년 중 일부만을 표본으로 사용한다.
모집단 | 모든 청소년 |
표본 | 청소년 100명 |
여기서 표본을 추출할 때 가장 중요한 것은 대표성이다. 여기서 '대표하다'는, 표본(청소년 100명)이 모집단(모든 청소년)을 대표하는 것을 의미한다. 다시 말해, 표본에 속한 청소년 100명만을 보고, 모든 청소년의 스마트폰 사용 시간을 알아낼 수 있어야 한다는 것이다.
대표성이라는 어휘가 다소 생소할 수 있다. 대통령을 한 번 떠올려보자. 한국 국민을 대표하는 대통령은, 걸음걸이, 태도, 인상, 외모에 신경을 써야 한다. 만약 대통령이 머리를 감지 않는다면, 전세계 정상들이 모인 자리에서 오해를 살 수 있을 것이다. '한국 사람들은 머리를 안 감는구나!'와 같이 말이다. 이러한 추정이 가능한 이유는, 대통령(표본)이 한국 국민(모집단)을 대표하기 때문이다.
그렇다면 다시 처음으로 돌아가 보자. 모든 청소년의 스마트폰 사용 시간을 알아내기 위해 100명의 청소년을 어떻게 표본 추출하면 좋을까? 만약 강남구에서만 100명을 추출한다고 가정해 보자. 강남구 학생들은 대체로 학원에서 많은 시간을 보내기에 스마트폰 사용 시간이 상대적으로 낮을 수 있다. 이 경우, 강남구 학생들의 스마트폰 사용 패턴을 전체 청소년으로 일반화하기는 어렵다.
반면, 부산 청소년 100명을 표본으로 선정한다면 어떨까? 부산은 게임산업이 발달해 있어 청소년들의 스마트폰 사용 시간이 상대적으로 높을 가능성이 있다. 이 사례 역시 부산 청소년의 스마트폰 사용 패턴을 전국 청소년에게 일반화하기에는 한계가 있다.
이러한 표본추출의 문제점을 해결하기 위해서는, 전국 여러 지역에서 골고루 표본을 추출하는 것이 바람직하다. 예를 들어, 각 지역별로 10명씩 추출한다면 더 높은 대표성을 확보할 수 있을 것이다.
표본은 모집단의 특성을 적절히 반영해야 하며, 이를 위해 다양한 표본추출 방법이 개발되었다. 대표적인 방법으로는 확률적 표본추출(무작위 표본추출, 층화 표본추출, 군집 표본추출 등)과 비확률적 표본추출(편의 표본추출, 판단 표본추출, 눈덩이 표본추출 등)이 있다.
표본의 크기도 중요한 고려사항이다. 표본이 너무 작으면 모집단을 대표하지 못하고, 너무 크면 자원 낭비가 발생한다. 연구의 목적, 정확도 요구 수준, 모집단의 이질성, 가용 자원 등을 고려하여 적절한 표본 크기를 결정해야 한다. 그러나 표본이 단순히 작다고 하여, 신뢰도가 떨어진다고 말할 수는 없다(김윤태, 사회학개론).
예시
1. 무작위 표본추출: 선거 여론조사에서 유권자 명부에서 무작위로 1,000명을 선정하여 투표 성향을 조사한다.
2. 층화 표본추출: 회사의 직원 만족도 조사에서 직급별(사원, 대리, 과장, 부장)로 비율에 맞게 표본을 추출한다. 예를 들어, 회사 전체 직원 중 사원이 40%라면, 표본에서도 사원이 40%를 차지하도록 한다.
3. 군집 표본추출: 전국 학생들의 학업 성취도를 조사할 때, 먼저 학교를 무작위로 선정한 후 선정된 학교의 모든 학생들을 조사한다.
4. 편의 표본추출: 길거리에서 지나가는 사람들에게 설문조사를 하거나, 온라인 커뮤니티에 설문 링크를 올려