커리어리 친구들, 오늘은 머신러닝의 귀찮은 작업들을 대부분 자동화 해 주는 오픈소스 파이썬 라이브러리인 PyCaret 을 소개합니다. 파이캐럿하니 왠지 이름도 귀엽죠? PyCaret 은 현재 2.3 버전이 나왔습니다. 또한 파이썬의 오픈소스 로우 코드 머신러닝 라이브러리로, 선택한 노트북 환경에서 데이터 준비에서 모델 배포까지 몇 분 안에 진행할 수 있습니다. PyCaret 의 설치 방법과 classification, regression, clustering, anomaly detection, ntp, association rule mining 자습서와 모듈과 더불어 풍부한 예제들이 아래의 URL이 있습니다. 한번 살펴 보시기 바랍니다. 또한 데이터 전처리가 여러분 매우 귀찮죠? 알고리즘 돌려서 예측하기도 바쁜데, 데이터 제대로 안되어 있으면 짜증 팍팍 나신 적 많으신가요? ㅎㅎ 그렇다고 현업에게 뭐라고 하지도 못하고요 ^^ 그럴때 from scratch (날코딩) 으로 시작하는 것 보다 Sample and Split, Data Preparation, Scale and Transform, Feature Engineering, Feature selection, unsupervised 들로 구분하여 자세히 설명하고 있습니다. 1. Sample and Split: Train Test Split, Sample 2. Data Preparation: Missing Values, Changing Data Types, One Hot Encoding, Ordinal Encoding, Cardinal Encoding, Handle Unknown Levels, Fix Imbalance 3. Scale and Transform: Normalization, Transformation, Target Transformation 4. Feature Engineering: Feature Interaction, Polynominal Features, Trigonometry Freatures, Group Features, Bin Numeric Features, Combine Rare Levels 5. Feature Selection: Featrue Importance, Remove Multicollinearity, Principal Component Analysis, Ignore Low Variance 6. Unsupervised: Create Clusters, Remove Outliers 이와 같이 상세 설명과 PycCaret 을 통해 어떻게 코딩하는지 예제도 함께 포함되어서 있어서 바로 현업에서 사용할 수 있어서 강력 추천합니다.

Home - PyCaret

PyCaret

Home - PyCaret

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2021년 12월 16일 오전 10:33

함께 읽은 게시물

이번 구글 I/O, 구글 여러분들 행사전에 입이 근질근질하셨겠네요. ㅎㅎ


내용은 다들 소개하셨으니 한줄평하자면, 구글이 처음으로 OpenAI에 비해 반발짝정도 앞서나간 이벤트인 것 같습니다.


더불어 출시한 모델과 서비스들을 보니.. 역시 AI는 돈빨이며 구글이 돈빨을 제대로 세웠.. 쿨럭..


타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

이번에 우아한형제들 기술 블로그에 "타입 안전한 API 모킹으로 프론트엔드 생산성 높이기"라는 새 글을 발행하게 되었습니다.

... 더 보기

노션 템플릿들을 만들면서 적는 회고

... 더 보기

이력서에 쓰는 경험



... 더 보기


Dependabot을 통한 안전한 의존성 관리

... 더 보기

 • 

저장 14 • 조회 3,568