커리어리 친구들, 인공지능 논문을 하나 소개합니다. 혹시 아마존 사이언스(Amazon Science)라는 웹사이트를 아시나요? 아마존의 인공지능 연구 관련하여 논문과 자료들을 모아둔 곳인데요, 요즘 제가 'AWS의 데이터 사이언스와 인공지능'에 대해 관련한 번역을 진행중인데, 가장 많이 하고 있는 것이 이 아마존 사이언스의 논문과 세이지메이커 온라인 문서들을 읽고 있습니다. 따라서, 여러분들께 이 논문을 읽고 보고 다음과 같은 점이 좋아서 공유합니다. 데이터 스트림 분석과 머신러닝에서 활용하고 있는데, 키네시스 데이터 어낼리틱스의 랜덤 컷 포레스트(RCF) Random Cut Forest (Random Cut Forest) 구현입니다. AWS가 공동 저술한 "스트림에서 강력한 랜덤 컷 포레스트 기반 이상 탐지(Robust Random Cut Forest Based Anomaly Detection on Streams)" 연구 논문을 기반으로 하고 있습니다. 이 논문에서는 실시간 데이터 스트림으로 온라인 학습을 위해 RCF를 사용하는 방법에 대해 자세히 설명하고 있습니다. 또한 AWS는 내장된 세이지메이커 알고리즘을 사용하여 오프라인 배치 훈련을 위한 RCF를 제공하고 있습니다. 이 논문에서 랜덤 컷 포레스트의 렌즈를 통해 동적 데이터 스트림에 대한 이상 탐지 문제에 초점을 맞춥니다. 입력 스트림의 스케치 또는 개요로 사용할 수 있는 강력한 랜덤 컷 데이터 구조를 조사합니다. 우리는 데이터의 나머지 부분에 대한 보이지 않는 지점의 영향, 즉 해당 지점에 의해 부과된 외부성을 기반으로 비모수적 이상에 대한 그럴듯한 정의를 제공합니다. 동적 데이터 스트림에서 스케치를 효율적으로 업데이트하는 방법을 보여줍니다. 공개적으로 사용 가능한 실제 데이터에 대한 알고리즘의 실행 가능성을 보여줍니다. 이미 읽어 보신 분들도 계시지만 RCF의 이상 탐지에 대한 솔루션을 찾고자 하는 분들께 도움 되기를 바라며, 반응이 좋으면, 아마존 사이언스에서 제가 읽었던 또 다른 논문을 소개하도록 하겠습니다.

Robust Random Cut Forest Based Anomaly Detection on Streams

Amazon Science

Robust Random Cut Forest Based Anomaly Detection on Streams

2021년 11월 10일 오전 2:45

댓글 0