[ 이상치 탐지하는 Isolation Forest ] 다양한 이상치 탐지 알고리즘이 있지만 Isolation Forest는 scikit-learn에 구현되어 있어 쉽게 쓸 수 있기도 하고, 메모리
[ 이상치 탐지하는 Isolation Forest ] 다양한 이상치 탐지 알고리즘이 있지만 Isolation Forest는 scikit-learn에 구현되어 있어 쉽게 쓸 수 있기도 하고, 메모리를 적게 사용하면서도 빠르게 사용할 수 있어 많이 쓰이는 알고리즘입니다. 전반적인 데이터를 살펴 '데이터 프로파일'을 파악하고 이상치를 탐지했던 것이 기존 알고리즘이었다면, Isolation Forest는 데이터를 여러 번 샘플링하고 BST(binary search tree)를 활용해서 이상치를 분리해내도록 합니다. 이해하기 쉽게 시각화까지 되어있는 자료를 찾아 소개합니다.