랜덤 포레스트(Random Forest)
랜덤 포레스트 모델은 결정 트리의 단점인 오버피팅 문제를 완화시켜주는 발전된 형태의 트리 모델입니다. 랜덤으로 생성된 무수히 많은 트리를 이용하여 예측을 하기 때문에 랜덤 포레스트라 불립니다. 이렇게 여러 모델(여기서는 결정 트리)을 활용하여 하나의 모델을 이루는 기법을 앙상블이라 부릅니다.
– 구분 : 지도 학습
– 문제 유형 : 회귀/분류
– 적합한 데이터 유형 : 일반적인 데이터
▼ TOP 10 선정 이유
앙상블 기법을 사용한 트리 기반 모델 중 가장 보편적인 방법입니다. 이후에 다루게 될 부스팅 모델에 비하면 예측력이나 속도에서 부족한 부분이 있고, 시각화에서는 결정 트리에 못미치나, 다음 단계인 부스팅 모델을 이해하려면 꼭 알아야 할 필수 알고리즘입니다.
▼ 예시 그래프
▼ 장점
- 결정 트리와 마찬가지로, 아웃라이어에 거의 영향을 받지 않습니다.
- 선형/비선형 데이터에 상관없이 잘 작동합니다.
▼ 단점
- 학습 속도가 상대적으로 느린 편입니다.
- 수많은 트리를 동원하기 때문에 모델에 대한 해석이 어렵습니다.
▼ 유용한 곳
- 앙상블 기법을 사용한 트리 기반 모델 중 가장 보편적인 방법입니다. 이후에 다루게 될 부스팅 모델에 비하면 예측력이나 속도에서 부족한 부분이 있고, 시각화 부분에서는 결정 트리에 못미치나, 다음 단계인 부스팅 모델을 이해하려면 꼭 알아야 할 필수 알고리즘입니다.
'빅데이터 & 인공지능' 카테고리의 다른 글
[머신러닝알고리즘] 라이트GBM(LightGBM) (0) | 2023.07.01 |
---|---|
[머신러닝알고리즘] XG부스트(XGBoost) (0) | 2023.07.01 |
[머신러닝알고리즘] 결정트리(Decision Tree) (0) | 2023.07.01 |
[머신러닝알고리즘] 나이브 베이즈(Naive Bayes) (0) | 2023.07.01 |
[머신러닝알고리즘] K-최근접 이웃(KNN) (0) | 2023.07.01 |