‘어떠한 데이터 셋에 대해서도 데이터 시각화를 자동으로 해서 보여준다’라고 자부하는 파이썬 패키지 ‘AutoViz’를 직접 사용해보았습니다 🧐
저는 Google Colab에서 유명한 데이터셋인 ‘iris’ dataset으로 돌려보았는데요!
boxplot, scattor plot, heatmap 등 데이터셋을 살펴보는 가장 기본적인 시각화를 엄청 쉽게, 엄청 빠르게 뽑아내줍니다 (클래스 내 약 10개의 키에 대한 value값만 넣어주면 됩니다..!)
[💡 큐레이터의 인사이트]
✔️ 어떤 데이터셋이든 처음 EDA에 굉장히 유용할 것 같습니다
✔️ 코드 가성비 갑입니다.
✔️ 주피터 노트북에서 인라인으로도 결과를 볼 수 있고, png로 바로 로컬 디렉토리에 저장도 됩니다.
✔️ EDA 결과를 통한 데이터 클렌징 추천 기능도 자동으로 해준다고 하네요!
데이터 탐색 과정에서 매우 유용한 것 같네요! 저도 앞으로 자주 사용해보려고 합니다
더 좋은 툴이나 데이터 탐색에 대한 팁이 있으신 분들은 얼마든지 말씀주세요! 🙂