백엔드 프레임워크 & 언어/Python

[프로젝트]데이터수집-머신러닝을 통한 삼성전자 주가 예측(1)

anodos 2023. 7. 9. 15:51

프로젝트 형식으로 공부하면서 정리 하기

 

목표

1. 크롤링을 통해  네이버  금융주가  주가 가져오기

2. 머신러닝알고리즘을 적용해 주가 예측 모델 만들기

3. 성능 좋은 모델을 만들기

 

1-1. 크롤링 대상 식별 및 확인

 

1-1-1. 크롤링이란?

-  크롤링 :  인터넷에서 데이터를 수집하는 방법

-  주의 : 각 포털은 크롤링 대응을 하기  때문에  UserAgent를 통해서 크롤링 방어를 우회하여야 함

 

1-1-2. 크롤링 대상 확인 (네이버 금융 페이지 삼성전자 주식데이터 일별시세 )

1) 네이버 금융(https://finance.naver.com/)

2) 상단메뉴 -> 국내증시 -> 시가총액(왼쪽메뉴) -> 삼성전자 -> 시세(중간쯤) 클릭 -> 일별시세

3) 일별 시세만을 가져오기 위해서 상단 URL 변경 (크롤링해서 가져올 페이지)

https://finance.naver.com/item/sise.naver?code=005930  

https://finance.naver.com/item/sise_day.naver?code=005930

 

크롤링할 대상은 다음과 같다!

 

반응형