toss
AI Engineer
정규직(풀타임)대면근무AI·머신러닝인프라·DevOps개발
AI 요약
토스 Affiliation의 AI Platform 팀에서 LLM 기반 컴포넌트(Retrieval, Generation, Vector Search), RAG, Agent 등의 기술을 플랫폼화하여 실험·서빙·운영할 AI 플랫폼 엔지니어를 채용합니다. SaaS 및 self-hosted LLM 연동, GPU 클러스터 운영, vLLM·Triton·Model Registry 등을 활용한 실험·배포 자동화 및 확장 가능한 공통 환경 설계가 주요 업무입니다.
주요 업무
LLM 기반 Retrieval/Generation/Vector Search 등 컴포넌트를 플랫폼화하여 재사용 가능한 환경 제공; SaaS 및 self-hosted LLM 연동 및 안정적 서빙 제공; Prompt, Tool, 컨텍스트 구성 등 Agent 시스템 실험·설계 기반 제공; RAG·Agent의 서빙과 운영 흐름 정리 및 도구화; Agent 성능·품질 정량화 기반 제공; 공통화된 실험 환경과 사용자 경험 설계 및 확장성 있는 플랫폼 방향 수립; GPU 자원·클러스터 운영 및 vLLM, Triton, Model Registry 등을 활용한 실험·배포 자동화 및 운영 최적화.
자격 요건
LLM, RAG, Agent 등의 기술을 실제 문제에 적용한 경험; 구조화되지 않은 문제를 기술적으로 정의하고 시스템적으로 해결한 경험; 여러 팀과 협업하며 기술을 제품처럼 설계·운영한 경험; 실험→서비스 전환 과정의 서빙·운영 경험. 우대: Retrieval/Generation/Vector Search 구성 설계 및 통합 경험, OpenAI API/HuggingFace/vLLM 등 다양한 LLM 서빙 구조 선택·운영 경험, 다양한 목적의 Agent 설계·운영 경험, 플랫폼·실험 도구 설계 경험, 다수 프로젝트에 확장 가능한 RAG/플랫폼 운영 경험, 운영 중 장애 대응·성능/리소스 최적화 경험, 오픈소스 기여 경험.
기술 스택
LLMRetrievalRAGAgentVector SearchVector DBOpenAI APIHuggingFacevLLMTritonModel RegistryGPU/클러스터모델 서빙Prompt/Tool/컨텍스트 구성검색 인프라