목표
1. 크롤링을 통해 네이버 금융주가 주가 가져오기
2. 머신러닝알고리즘을 적용해 주가 예측 모델 만들기
3. 성능 좋은 모델을 만들기
3-1. 앙상블 모형을 이용한 성능개선
# K 최근접 이웃 분류 : 1
# 결정트리 : 1
# 로지스틱 회귀 : 0
Voting 방식에 따라 1이 2개이므로 1을 선택
from sklearn.neighbors import KNeighborsClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import VotingClassifier
model_list =[('knn',KNeighborsClassifier()),
('dt', DecisionTreeClassifier(max_depth=5)),
('lr', LogisticRegression())]
ensemble = VotingClassifier(estimators=model_list)
ensemble.fit(train_scaled, y_train)
ensemble.score(test_scaled, y_test)
그래도 결과가 그닥 좋지 못한다. 한개를 가지고 예측하는 것보다 그래도 더 좋은 결과를 예측해 볼수 있다.
모델이나 데이터에 문제가 있을 있을 수 있다. 데이터를 보면 전일 종가로 금일 가격을 예측하는 것 보다 10개씩 묶어서 경향성을 보면 더 낳을 것 예상~ 딥러닝 활용