커리어리 친구들, 오늘은 머신러닝의 귀찮은 작업들을 대부분 자동화 해 주는 오픈소스 파이썬 라이브러리인 PyCaret 을 소개합니다. 파이캐럿하니 왠지 이름도 귀엽죠? PyCaret 은 현재 2.3 버전이 나왔습니다. 또한 파이썬의 오픈소스 로우 코드 머신러닝 라이브러리로, 선택한 노트북 환경에서 데이터 준비에서 모델 배포까지 몇 분 안에 진행할 수 있습니다. PyCaret 의 설치 방법과 classification, regression, clustering, anomaly detection, ntp, association rule mining 자습서와 모듈과 더불어 풍부한 예제들이 아래의 URL이 있습니다. 한번 살펴 보시기 바랍니다. 또한 데이터 전처리가 여러분 매우 귀찮죠? 알고리즘 돌려서 예측하기도 바쁜데, 데이터 제대로 안되어 있으면 짜증 팍팍 나신 적 많으신가요? ㅎㅎ 그렇다고 현업에게 뭐라고 하지도 못하고요 ^^ 그럴때 from scratch (날코딩) 으로 시작하는 것 보다 Sample and Split, Data Preparation, Scale and Transform, Feature Engineering, Feature selection, unsupervised 들로 구분하여 자세히 설명하고 있습니다. 1. Sample and Split: Train Test Split, Sample 2. Data Preparation: Missing Values, Changing Data Types, One Hot Encoding, Ordinal Encoding, Cardinal Encoding, Handle Unknown Levels, Fix Imbalance 3. Scale and Transform: Normalization, Transformation, Target Transformation 4. Feature Engineering: Feature Interaction, Polynominal Features, Trigonometry Freatures, Group Features, Bin Numeric Features, Combine Rare Levels 5. Feature Selection: Featrue Importance, Remove Multicollinearity, Principal Component Analysis, Ignore Low Variance 6. Unsupervised: Create Clusters, Remove Outliers 이와 같이 상세 설명과 PycCaret 을 통해 어떻게 코딩하는지 예제도 함께 포함되어서 있어서 바로 현업에서 사용할 수 있어서 강력 추천합니다.

Home - PyCaret

PyCaret

Home - PyCaret

2021년 12월 16일 오전 10:33

지금 가입하고 개발 트렌드 뉴스레터를 받아보세요!

개발 관심 분야 중 하나를 관심 분야로 선택하면 받아볼 수 있어요.

이메일로 가입하기