통계는 표본을 통해 모집단의 특성을 파악하는 것을 의미한다.
Population(모집단) 이란 파악하고자 하는 대상을 말한다. 예를 들어 차기 대선주자에 대한 국민들의 선호도를 알고 싶다면, 모집단인 전체 국민들에게 물어 봐야 한다. 그런데 실제로 모집단을 알기란 쉽지 않다. 전수 조사를 하려면 비용이 어마어마하게 필요할 뿐아니라 돈이 있다고 하더라도 참여를 하지 않는 국민들이 있기 때문에 조사 자체가 불가능하다.
때문에 우리는 이러한 모집단의 특성을 알기 위해서 표본을 사용한다. Sample(표본)이란 통계적 판단을 위해 모집단에서 선택된 작은 집단을 의미한다. 우리가 주변에서 가장 쉽게 접할 수 있는게 여론조사다. 대통령 수행 지지도, 차기 대선후보 지지율 등을 조사할때 우리는 특정 표본을 대상으로 설문조사를 하고 이를 통해 지지율을 추정하는 것이다.
Sampling(표본추출)이란 모집단에서 표본을 추출하는 것을 의미한다. 여론조사 대상을 선정하는 것을 의미하며, Inference(추정)란 표본을 대상으로한 여론조사 결과를 가지고 대선주자 선호도 유추하는 것을 의미한다.
통계는 그 목적에 따라 표본의 특성을 요약하는 기술통계(descriptive statistics)와 기술통계에 근거해 보편적인 진리 즉 모지반의 특성을 추론하는 추론통계(Inferential statistics)로 나눌 수 있다.
예를 들면 남녀 백명의 평균 몸무게를 구하는 것은 기술통계이고 이를 통해 남자가 여자보다 덩치가 크다는 것을 추론하는 것이 추론통계라 할 수 있다.
'회사 생활' 카테고리의 다른 글
[데이터분석 준전문가] 데이터의 이해 (0) | 2020.08.08 |
---|---|
통계 Tool. (0) | 2020.07.21 |