DATA SET 분할

전체 데이터 중 학습을 시키기 위한 데이터는 70 ~ 80%(train data), 학습된 모델이 다른 데이터에도 맞는지 확인하기 위한 테스트 데이터는 20~30%가량 나눔

 

이유는 일반화를 검증 및 일반화에 적합한 모델을 확인하기 위함.

 

 

 

'빅데이터 & 인공지능' 카테고리의 다른 글

[머신러닝알고리즘] 선형회귀분석  (0) 2023.07.01
DATA 전처리(Preprocessing)  (0) 2023.07.01
머신러닝 프로세스  (0) 2023.07.01
03.통계기법 이해  (0) 2023.06.30
로그변환  (0) 2023.06.29