통계의 이해
통계 개요
통계와 표본조사
통계의 이해
- 분석하고자 하는 집단에 대해 조사하거나 실험을 통해 얻는 자료 또는 요약된 형태를 말한다.
- 통계학이란 불확실한 상황에서 효과적인 의사결정을 할 수 있도록 수치자료를 수집하고, 정리하고, 표현하고, 분석하는 이론과 방법을 연구하는 학문이다.
- 통계분석이란 특정집단을 대상으로 자료를 수집하여 대상집단에 대한 정보를 구하고, 적절한 통계분석 방법을 이용하여 의사결정(통계적 추론)을 하는 과정을 말함
표본조사 ⭐️⭐️
- 어떠한 모집단을 대표할 수 있는 표본집단을 선별하여 표본조사를 실시
- 표본집단은 반드시 모집단을 대표할 수 있는 집단이어야한다. 이를 표본의 대표성이라 한다.
- 표본의 대표성을 신뢰할 수 있어야 표본조사를 통한 모집단의 통계분석 또한 신뢰할 수 있다.
- 따라서 이 표본을 어떻게 추출할 것인지에 관한 방법은 매우 중요
표본추출 방법 ⭐️⭐️
단순 램덤 추출법
- 표본추출 방법 중 가장 쉽고 단순한 방법
- N개의 모집단에서 n개의 데이터를 무작위로 추출하는 방법
계통 추출법
- 모집단의 원소에 차례대로 번호를 부여한 뒤 일정한 간격을 두고 데이터를 추출하는 방법
- N개의 모집단에서 K개씩(K=N/n) n개의 구간으로 나눈다. 첫 구간에서(1, 2, 3…K개의 구간) 하나를 임의 선택하고 K개씩 띄어서 표본을 추출
집락(군집: Cluster) 추출법
- 데이터를 여러 집락으로 구분한 뒤, 단순 램덤 추출법에 의하여 선택된 집락의 데이터를 표본으로 사용하는 방법
- 각 집락은 서로 동질적이며, 집락 내 데이터는 서로 이질적이다.
층화 추출법
- 집락 추출법과 유사하나 반대의 성격을 지닌 추출 방법
- 데이터를 여러 집락으로 구분하지만 각 집락은 서로 이질적이며, 군집 내 데이터들은 서로 동질적이다.
- 집락을 나눈 뒤, 각 집락에서 원하는 개수의 데이터를 추출하여 추출된 데이터에 대해 표본조사를 실시
- 집락별로 추출되는 데이터의 비율을 어떻게 정할 것인지에 따라 비례 층화 추출법과 불비례 층화 추출법으로 나눌 수 있다.
측정과 척도 ⭐️⭐️⭐️
측정과 척도의 개념
- 측정 - 표본조사를 실시하는 경우 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하게 관측해 자료를 얻는 것
- 척도 - 관측 대상의 속성을 측정하여 그 값이 숫자로 나타나도록 일정한 규칙을 정하여 바꾸는 도구
척도의 종류
기술통계와 추리통계 ⭐️⭐️
기술통계
- 표본 자체의 속성이나 특징을 파악하는데 중점을 두는 데이터 분석 통계
- 자료를 요약하고 조직화, 단순화하는데 그 목적이 있다.
- 표본조사 이후 표본을 설명해주는 데이터의 최솟값, 최댓값, 중위수 등의 통계량이 바로 기술 통계량이며, 모집단의 톡성을 유추하는데 사용할 수 있다.
추리통계(추론통계)
- 수집한 데이터를 바탕으로 ‘추론 및 예측’하는 통계 기법
- 표본에서 얻은 통계치를 바탕으로 오차를 고려하면서 모수를 확률적으로 추정하는 통계 기법
- 표본에서 얻은 통계치를 가지고 모집단의 특성을 추정하는 데 초점을 두고 가설을 검증하거나 확률적인 가능성을 파악한다. 이를 통해 향후 발생할 수 있는 사건을 예측할 수 있다.
확률과 확률분포
확률 기초 ⭐️⭐️
- 확률 - 발생 가능한 모든 사건들의 집합 표본공간에서 표본공간의 부분집합인 특정 사건 A가 발생 할 수 있는 비율을 나타내는 값으로, 0과 1 사이의 값이며, 가능한 모든 사건의 확률의 합은 항상 1이다.
- 조건부 확률 - 특정 사건 A가 발생했다는 것이 사실이라는 전제하에 또 다른 사건 B가 발생할 확률을 나타낸 값으로, 0과 1 사이의 값을 갖는다.