전체 데이터 중 학습을 시키기 위한 데이터는 70 ~ 80%(train data), 학습된 모델이 다른 데이터에도 맞는지 확인하기 위한 테스트 데이터는 20~30%가량 나눔
이유는 일반화를 검증 및 일반화에 적합한 모델을 확인하기 위함.
'빅데이터 & 인공지능' 카테고리의 다른 글
[머신러닝알고리즘] 선형회귀분석 (0) | 2023.07.01 |
---|---|
DATA 전처리(Preprocessing) (0) | 2023.07.01 |
머신러닝 프로세스 (0) | 2023.07.01 |
03.통계기법 이해 (0) | 2023.06.30 |
로그변환 (0) | 2023.06.29 |