Random Forest for Feature Importance
Medium
실제 분석을 수행할 때 고민이 되는 문제 중 하나가 중요한 변수와 중요하지 않는 변수를 구분하는겁니다. 회귀분석을 진행할 경우 흔히 VIF(Variance Inflation Factors, 분산팽창요인)를 이용한 다중공선성 진단을 통해 변수를 선택하는 경우가 많은데요, 회귀모델을 사용하지 않을 경우 랜덤포레스트 모델을 통해 각 변수의 엔트로피를 계산하여 변수를 선택하는 방법도 있습니다. 미디엄에서 이런 방법에 대해 설명한 글을 찾아 공유드립니다.
2020년 11월 30일 오전 9:08