프로필 이미지

정태

소프트웨어 엔지니어

스킬

python

머신 러닝

Github

Docker

AWS

PyTorch

경력 ・ 4년 3개월

딜러타이어 - 인공지능 엔지니어

2023.02 ~ 현재

스킬: python, AWS, Docker, 머신 러닝, Github, PyTorch

모델링, 모델 학습/추론 파이프라인 배포, 최적화 등 머신러닝 관련 모든 프로젝트를 전담 RestAPI 및 엔진 API 문서화를 통해 백엔드 파트와의 협업에서 발생하는 커뮤니케이션 비용 최소화 감성분석 및 자동분류 자연어처리 솔루션인 Deep Review 개선 업무 수행 Lightning과 Deepspeed 기반 NLP 엔진(Deep-STA 3.0) 구축 및 ML 백엔드 서버를 배포 single-node, multi-gpu 학습에서의 GPU 사용률을 100%로 개선 epoch당 학습 시간 15%, 추론 시간 12% 추가 단축. Regularization 적용 및 대스타 해결사 플랫폼 프로젝트 산출물인 신형 데이터 증강 모듈 적용 실고객 데이터 23개 label classification 기준 Weighted F1 Score 기준 0.87에서 90%로 3% 상승 타이어 마모도 체크, 스펙 확인 및 이상치를 감지하는 모델 및 ML 백엔드 & 데모 제작 프로젝트 진행 기획, ML 백엔드, 모델링 등 프로젝트 전반을 전담 Patchcore 기반 이상감지 모델 및 CRAFT 기반 OCR 모델, ResNet 기반 이미지 모델 사용 타이어 데이터 수집을 위한 한국타이어 스마트오피스 이미지 데이터 크롤링 파이프라인 작업 labelbox를 활용한 텍스트 데이터 레이블링 환경 및 검수 환경 구축 gradio를 활용한 타이어 마모도 MVP 데모 제작 완료 conda, nvidia-docker, Jupyter Hub 등 온프레미스 서버 환경 구축 Github Action을 활용하여 사내 ML 백엔드 서버의 온프레미스 서버로의 자동 테스트 및 배포 파이프라인을 구축 이외 Time Series 예측 파이프라인을 도입하여 자체 커머스의 타이어 주문건수 예측 진행

인스유틸 - 인공지능 엔지니어

2021.10 ~ 2023.02

자연어처리 관련 연구원으로서 머신러닝 모델 모델링 및 모델 최적화에 대한 프로젝트를 전담함 자체 언어모델을 활용, 고객 리뷰를 분류하고 감성분석하는 자연어처리 솔루션인 Deep Review 개발 참여 ML 파트를 담당하여 기존 엔진 리팩토링 및 Nvidia Apex 기반 엔진으로 개량 epoch당 학습속도 30% 개선, single-node multi-gpu 학습 Trainer 제작 Wordnet과 자체 보유 MLM 언어모델 기반 데이터 증강 모듈 제작 Cross Validation과 confusion matrix등 다양한 성능 평가 기능 및 metric 기능 개발 해당 도구를 통하여 모델을 디버깅, 데이터 증강과 모델 파라미터 증가등 다양한 성능 증가 기법 적용 실고객 데이터의 103개 카테고리 분류 과제에서 Weighted F1 Score 기준 약 10% 성능 향상 TIPS 과제인 STT/TA 솔루션 구축 프로젝트를 전담 Nvidia NeMo 툴킷 및 자체 제작 엔진을 기반으로 음성 데이터의 증강, 음성인식 모델 및 텍스트 분석 모델을 학습 및 평가하는 업무를 맡음 데이터 파이프라인을 수정하여 기존과 달리 SpecAug 모듈이 새로운 데이터를 생성하도록 변경, 데이터 증강이 CER 상승에 적게 기여하는 문제를 해결 테스트 CER(Character Error Rate) 기준 0.12%, 자체 엔진 감성분류 F1 Score 0.86을 달성 “대 스타 플랫폼: 자연어처리 분야” 대상 수상 후 증강 모듈 최적화 진행 불필요한 반복문을 제거, CPU 기반 모델 기준 데이터 증강 속도 기존 대비 15% 향상 Faiss 및 Pytorch 기반 모델 GPU 사용 모델 사용시 GPU를 multi-gpu에서 100% 활용 가능하도록 구축 FastAPI를 사용, RestAPI를 통해 하이퍼파라미터 지정 후 데이터 증강이 가능한 시스템 구축

교육

방송통신대학교 - 데이터통계학과

2022.03 ~ 현재

한국과학기술원(KAIST) - 기초기계학습 마이크로디그리

2022.09 ~ 2023.04

컴퓨터 공학(자료구조 및 서칭 알고리즘) 데이터사이언스 프로그래밍 및 통계학 기본 인공지능 교육 기본 강화학습 교육

공주대학교 - 경제학부 경제학전공

2015.03 ~ 2021.09

개발 트렌드부터 Q&A, 네트워킹까지

요즘 개발자들의 필수 커뮤니티, 커리어리