모수와 Maximum Likelihood Estimation(MLE)

통계적 모델링은 적절한 가정 위에서 확률 분포를 추정이 목표
유한한 개수의 데이터만 관찰해서 모집단의 분포를 정확하게 알기는 힘듦
- 근사적으로 확률 분포를 추정
데이터가 특정 확률 분포를 따른다고 선험적으로(a priori) 가정한 후 그 분포를 결정하는 모수(parameter)를 추정하는 방법 → 모수적(parameteric) 방법론
- Ex. 정규 분포를 가지고 확률 분포를 모델링한다고 할 때 정규 분포의 모수(평균, 분산)를 추정하는 방법을 통해 데이터 학습
특정 확률 분포를 가정하지 않고 데이터에 따라 모델의 구조 및 모수의 개수가 유연하게 바뀌면 비모수(nonparametric) 방법론이라고 함
- 모수가 없는 경우가 아니라 모수가 무한히 많거나 모수의 개수가 데이터에 따라 바뀌는 경우를 의미

확률 분포 가정하는 방법
- 데이터가 2개의 값(0 또는 1)만 가지는 경우 → 베르누이 분포
- 데이터가 n개의 이산적인 값을 가지는 경우 → 카테고리 분포
- 데이터가 [0, 1] 사이에서 값을 가지는 경우 → 베타 분포
- 데이터가 0 이상의 값을 가지는 경우 → 감마 분포, 로그정규분포 등
- 데이터가 $\R$ 전체에서 값을 가지는 경우 → 정규 분포, 라플라스 분포 등
기계적으로 확률 분포를 가정해면 안 됨
1. 데이터가 어떻게 생성됐는지 원리를 먼저 고려
2. 어떤 확률 분포가 적절한지를 분석 후 선택
3. 각 분포마다 검정하는 방법들이 있으므로 모수를 추정한 후에는 반드시 검정

표집분포와 표본 분포는 다름
표집분포(Sampling distribution)
- 통계량의 확률분포
  - 표본들의 분포가 아니라 표본 평균과 표본 분산의 확률 분포 → 표집 분포
- 표본평균의 표집분포는 N이 커질수록(데이터를 많이 모을수록) 정규분포를 따름 → 중심 극한 정리(Central Limit Theorem)
표본분포(Sample distribution)
- Ex. 모집단의 분포가 정규분포를 따르지 않는다 → Sample distribution은 데이터를 많이 모아도 정규분포가 될 수 없음