
rapportlabs
MLOps Engineer
정규직(풀타임)대면혼합근무AI·머신러닝인프라·DevOps개발
AI 요약
라포랩스에서 실제 트래픽 환경에서 머신러닝 모델을 안정적으로 서빙·운영하고 지속적으로 개선할 MLOps Engineer를 채용합니다. 모델 서빙·모니터링·재학습 파이프라인 설계·운영, 리소스 및 추론 최적화, 재현 가능한 실험 환경 구축, ML 시스템 전반의 기술적 의사결정과 운영 기준 정의가 주요 업무입니다. Kubernetes, Triton/vLLM, Terraform·Helm·ArgoCD 등 인프라 자동화 및 대용량 트래픽 운영 경험을 요구합니다.
주요 업무
머신러닝 모델의 서비스 환경 서빙 및 운영, 모델 로딩·추론 경로·리소스(CPU/GPU/Memory) 분석 및 최적화, 모델 모니터링 체계 설계·운영, 로그·메트릭 기반 모델 상태 지표 개발, 데이터·학습 파이프라인 설계 및 고도화, 재현 가능한 실험 환경 구축 및 실험 관리, ML 서비스 개발 환경 개선, ML 시스템 전반의 기술적 의사결정 및 MLOps/운영 기준 정의.
자격 요건
서비스 운영 관점에서 MLOps를 적용·고도화한 경험, 모델 학습→배포→서빙→모니터링→재학습의 엔드투엔드 운영 경험, 트래픽 환경에서 모델 운영·운영 이슈(성능 저하·데이터 분포 변화·이상치) 대응 경험, Kubernetes 기반 ML 서비스 운영 경험, GPU/CPU 워크로드 특성 이해 및 리소스 조율 경험, 운영을 고려한 구조화된 ML 서버사이드 코드 작성 능력, ML 서빙 API 설계·운영 경험, Triton·vLLM 등 추론 서버 운영 경험, 엔지니어·기획·데이터 협업 및 기술적 의사결정 조율 능력, 커뮤니케이션 능력. 우대: 이커머스 도메인(추천/검색/랭킹/개인화/수요예측) 운영 경험, Multi-Node GPU 학습 파이프라인 운영, DevOps/IaC 경험(Terraform/Helm/ArgoCD), 대용량 트래픽 운영 및 장애 대응 경험, 인프라 설계 주도 경험.
기술 스택
GitDockerTerraformHelmArgoCDAirflowMlflowFastAPIKubernetesGKEEKSSparkTritonvLLMGPU/CPU 워크로드