[노트정리] 1. 통계란 무엇인가?

1. 통계학은 데이터의 수집, 분석, 해석 전달에 관한 학문

- 데이터 수집

- 데이터 분석

   - 데이터의 전체의 이해 (EDA)

   - 개별 변수의 이해 (히트맵)

   - 변수 간 관계의 이해 

   - 관측대상의 이해

 

과거의 통계학 : 작은 데이터셋 중심의 국소적 측면

현재의 통게학 : 라지 사이즈 데이터, 데이터 통계학

 

 

2. 통계분석

특정집단의 자료를 수집하여 대상에 대한 정보를 구하고, 적절한 분석방법을 이용하여 의사결정, 통계적 추론을 하는 과정

 

기술통계

- 주어진 자료의 특성은 객관적 데이터로 나타내는 통계분석방법(describe())

- Sample에 대한 평균, 표준편차, 최빈 값 등

 

추론통계

- 모수 추정

- 가설 검정

- 예측

 

표본집단 -> 모집단 추론

 

 

3. 통계분석 Flow (머신러닝 Flow와 유사)

문제 정의 -> 데이터 수집 -> 데이터 탐색 및 전처리 -> 데이터 변환/정제 -> 통계 모형 수립(모델링과정) -> 모형 적합 -> 모형평가 -> 결론도출

 

목적이 무엇인가?  예측, 변수의 분류, 종속변수와의 관계