[머신러닝알고리즘] 라이트GBM(LightGBM)

라이트GBM(LightGBM)

XGBoost 이후로 나온 최신 부스팅 모델입니다.

LightGBM이 등장하기 전까지는 XGBoost가 가장 인기있는 부스팅 모델이였지만, 점점 LightGBM이 XGBoost와 비슷한 수준 혹은 그 이상으로 활용되는 추세입니다. 캐글 컴피티션에서도 좋은 퍼포먼스를 많이 보여주어서 그 성능을 인정받았습니다. 리프 중심 트리 분할 방식을 사용합니다.

 

– 구분 : 지도 학습
– 문제 유형 : 회귀/분류
– 적합한 데이터 유형 : 일반적인 데이터

 

▼ TOP 10 선정 이유

표로 정리된 데이터(tabular data)에서 Catboost, XGBoost와 함께 가장 좋은 성능을 보여주는 알고리즘입니다.

성능을 비교하는 자료를 보면 대체로 LightGBM과 Catboost가 XGBoost보다 나은 성능을 보여주며, LightGBM과 Catboost는 상황에 따라 다른 결과를 보여주어 우열을 가리기 어렵습니다.

다만, 사람들에게 활용/언급되는 빈도는 아직까지는 LightGBM이 우위를 보입니다.

 

▼ 예시 그래프

▼ 장점

  • XGBoost보다도 빠르고 높은 정확도를 보여주는 경우가 많습니다.
  • 예측에 영향을 미친 변수의 중요도를 확인할 수 있습니다.
  • 변수 종류가 많고 데이터가 클수록 상대적으로 뛰어난 성능을 보여줍니다.

▼ 단점

  • 복잡한 모델인 만큼, 해석에 어려움이 있습니다.
  • 하이퍼파라미터 튜닝이 까다롭습니다.

▼ 유용한 곳

표로 정리된 데이터(tabular data)에서 캣부스트, XGBoost와 함께 가장 좋은 성능을 보여주는 알고리즘입니다. 성능을 비교하는 자료를 보면 대체로 LightGBM와 캣부스트가 XGBoost보다 나은 성능을 보여주며, LightGBM과 캣부스트는 상황에 따라 다른 결과를 보여주어 우열을 가리기 어렵습니다. 다만, 사람들에게 활용/언급되는 빈도는 아직까지는 LightGBM이 우위를 보입니다.

 

출처 : 확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘