1. 통계학은 데이터의 수집, 분석, 해석 전달에 관한 학문
- 데이터 수집
- 데이터 분석
- 데이터의 전체의 이해 (EDA)
- 개별 변수의 이해 (히트맵)
- 변수 간 관계의 이해
- 관측대상의 이해
과거의 통계학 : 작은 데이터셋 중심의 국소적 측면
현재의 통게학 : 라지 사이즈 데이터, 데이터 통계학
2. 통계분석
특정집단의 자료를 수집하여 대상에 대한 정보를 구하고, 적절한 분석방법을 이용하여 의사결정, 통계적 추론을 하는 과정
기술통계
- 주어진 자료의 특성은 객관적 데이터로 나타내는 통계분석방법(describe())
- Sample에 대한 평균, 표준편차, 최빈 값 등
추론통계
- 모수 추정
- 가설 검정
- 예측
표본집단 -> 모집단 추론
3. 통계분석 Flow (머신러닝 Flow와 유사)
문제 정의 -> 데이터 수집 -> 데이터 탐색 및 전처리 -> 데이터 변환/정제 -> 통계 모형 수립(모델링과정) -> 모형 적합 -> 모형평가 -> 결론도출
목적이 무엇인가? 예측, 변수의 분류, 종속변수와의 관계
'빅데이터 & 인공지능' 카테고리의 다른 글
[노트정리] 4.통계검정의 개념 (0) | 2023.07.08 |
---|---|
[노트정리] 2. 모집단과 표본집단의 개념 (0) | 2023.07.08 |
빅분기 5회 실기 기출 (0) | 2023.07.02 |
빅분기 4회 실기 기출 (0) | 2023.07.02 |
빅분기 3회 실기 기출 (0) | 2023.07.02 |