프로필 이미지

Jonas Kim

데이터 과학자, ML 엔지니어

🧑‍💻 ML 분야에서 오랜 경력을 쌓아온 전문가입니다. 금융 및 IT 업계에서 일했으며 CV, NLP, RecSys, MLOps를 다루었습니다. 프로젝트 관리, 팀 빌딩 스킬에도 관심이 많습니다. 📚 '데이터 과학자 원칙' 공저, '머신러닝 시스템 설계' 공역

스킬

머신 러닝

python

AWS

SQL

데이터 분석

경력 ・ 15년

- 시니어 데이터 사이언티스트

2020.12 ~ 현재

스킬: python, SQL, AWS, 머신 러닝, 데이터 분석

수천 개 제품 대상으로 DeepAR 기반의 수요 및 판매 예측 모델을 개발하고 정확도를 기존 대비 2배 이상 향상하였습니다. 또한 AWS 세이지메이커와 CDK를 이용하여 CI/CD 및 ML 파이프라인을 구축함으로써 신규 모델 배포에 소요되는 시간을 절반 이하로 단축했습니다. 연료 형상 이미지와 센서 시계열 데이터를 통해 발열량을 추정하는 멀티모달 모델을 스윈 트랜스포머 및 TFT 기반으로 구현하여 정확도를 기존 대비 20% 향상하고 대시보드 시각화로 현장에 적용했습니다. 스테이블 디퓨전, 컨트롤넷 모델 파인튜닝으로 패션 이미지 생성 모델을 개발하여 패션 디자이너의 작업 과정을 효율화하였습니다. 기업 내부 문서 검색과 인프라 모니터링을 위해 클로드와 아마존 오픈서치를 사용한 검색 증강 생성(RAG)과 LLM 에이전트 시스템을 구축하였고 이를 통해 엔지니어들의 업무 시간을 단축시켰습니다.

현대카드 - 머신러닝 엔지니어 (팀장)

2017.01 ~ 2020.12

패션 웹사이트 검색 서비스에 암시적 피드백 BPR - MF와 뉴럴 CF 등을 활용한 패션 웹사이트 추천 시스템을 개발하여 CTR 상승을 이끌었습니다. 아파치 에어플로 중심으로 모델링 작업흐름을 자동화하는 프로젝트를 주도하여 신규 모델 배포에 소요되는 시간을 절반 이하로 단축했습니다. 매주 1TB 이상 수집되는 온라인 광고 네트워크 데이터를 기반으로 고객 획득 프로젝트를 이끌었습니다. 팀원들은 AWS EMR로 개발 인프라와 데이터 파이프라인을 구축하고, 디스플레이 광고에 대한 반응 예측 모델을 배포하고, A/B 테스트를 수행하여 CTR을 개선했습니다. 개인 맞춤형 신용카드 혜택 추천 서비스를 위해 DeepFM 기반의 알고리즘을 개발하고 데이터 전처리 및 예측 작업은 스파크 병렬 클러스터 기반으로 구축하여 성능을 최적화했습니다. 본 혜택 서비스 사용자는 1년 만에 150배 증가했습니다. 수십만 개의 가맹점을 의미론적 벡터로 표현하기 위해 Merchant2vec라고 하는 가맹점 임베딩 모델을 만들었습니다. 해당 모델을 초개인화 마케팅 플랫폼에 제공하여 솔루션 판매를 도왔습니다.

- 데이터 사이언티스트

2015.08 ~ 2016.12

GBDT 알고리즘으로 이탈 예측 모델을 만들어 사용자 경험 개인화 서비스 엔진에 탑재했습니다. 이탈 점수에 기반한 문자 메시지로 사용자 잔존율이 향상되었습니다. 가설에 대한 A/B 테스트를 반복적으로 실행할 수 있는 플랫폼을 설계하고 개발에 참여했습니다. 이를 통해 수십 개의 실험을 동시에 실행할 수 있게 되었습니다. 성향 점수 매칭 등 인과 추론 기법을 통해 게임 콘텐츠를 분석하고 인사이트를 도출하였습니다.

신영증권 - 주니어 퀀트, CFA

2009.12 ~ 2015.08

PDE 유한차분법 또는 MC 시뮬레이션을 통해 다양한 이색 옵션 가격 결정 모델( 주가 국소 변동성으로 보정한 ELN, LGM 모델을 이용한 이자율 콜러블 레인지 어크루얼 스왑 및 노트, CDS 등)을 구현하였습니다. 시장 VaR 계산 및 스트레스 테스트 수행 기능 개발로 리스크 관리 시스템을 개선하였습니다.

교육

서울대학교 - 통계학과 석사

2008.03 ~ 2010.02

성균관대학교 - 통계학과 학사

2001.03 ~ 2008.02

링크

개발 트렌드부터 Q&A, 네트워킹까지

요즘 개발자들의 필수 커뮤니티, 커리어리