toss
ML Platform Team Leader
정규직(풀타임)대면근무AI·머신러닝인프라·DevOps
AI 요약
토스뱅크 Affiliation의 ML Platform 리더 채용공고입니다. ML Ops 파트와 LLM 파트를 총괄하며 쿠버네티스 기반의 확장 가능하고 안정적인 MLOps 플랫폼 설계·운영, 최신 LLM 애플리케이션 및 LLM Ops 환경 구축을 리드하는 역할입니다. 팀의 기술 비전 수립, 멘토링, 조직 간 협업을 통해 전사 AI 개발 생산성 및 개발자 경험(DX)을 개선하는 것이 주요 목표입니다.
주요 업무
ML Platform 팀(ML Ops Part, LLM Part)의 기술 비전 및 중장기 로드맵 수립·실행 리드; 팀 멘토링, 코드리뷰, 성과관리로 팀 성장 주도; Kubernetes 기반의 확장 가능하고 안정적인 ML Platform(모델 학습·배포·서빙·모니터링) 설계·운영 총괄; LLM 애플리케이션 기술 리드 및 대규모 모델 파인튜닝·서빙·평가를 위한 LLM Ops 환경 구축; 데이터 사이언티스트·ML 엔지니어·프로덕트 등 유관부서와 협업해 병목 해결 및 개발자 경험(DX) 극대화; 최신 MLOps·LLM 기술 리서치 및 전사 AI 기술 스택 아키텍처 설계; 안정성·비용효율성·성능 최적화를 위한 지표 정의 및 개선
자격 요건
엔지니어링 팀(ML, Infra, Platform 등) 리드 경험(기술 비전 제시·로드맵 수립·팀원 육성) 보유; Kubernetes 기반 MLOps 플랫폼(Kubeflow, MLflow, CI/CD, 모델 서빙 등) 구축·운영 실무 경험; LLM Application(RAG, Fine-tuning, Agent 등) 개발 및 LLM Ops(대규모 모델 서빙, Vector DB, 평가 파이프라인) 이해 및 실무 경험; 대규모 트래픽·데이터 처리 시스템 아키텍처 설계 및 최적화 경험 선호; 복잡한 기술적 문제 정의·커뮤니케이션·전략적 문제 해결 능력; 비즈니스 임팩트 및 개발자 경험을 고려한 플랫폼 설계에 대한 열정
기술 스택
KubernetesKubeflowMLflowCI/CDMLOps모델 서빙모니터링LLMRAGFine-tuningAgentVector DB평가 파이프라인대규모 시스템 아키텍처성능 최적화