
anthropic
Staff Software Engineer, Inference
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Anthropic의 Inference 팀에서 Claude 모델을 전 세계 사용자에게 효율적으로 서비스하기 위한 대규모 분산 시스템 및 인프라를 구축하는 Staff Software Engineer를 채용합니다. 고성능 추론 최적화와 클라우드 오케스트레이션을 통해 연구와 비즈니스 성장을 동시에 지원하는 핵심 역할을 수행합니다.
주요 업무
Claude 서비스 인프라 구축 및 유지보수; 지능형 라우팅 알고리즘 설계 및 최적화; 컴퓨팅 플릿 자동 확장(Autoscaling) 구현; 신규 모델 배포 파이프라인 구축; 신규 AI 가속기 플랫폼 통합; 추론 기능(구조화된 샘플링, 프롬프트 캐싱 등) 개발 기여; 관측 데이터 분석을 통한 성능 튜닝.
자격 요건
학사 학위 이상 또는 그에 준하는 경력; 대규모 분산 시스템 설계 및 운영 경험; 성능 최적화 및 지능형 요청 라우팅 숙련도; Kubernetes 및 클라우드 인프라(AWS, GCP) 활용 능력; Python 또는 Rust 숙련도; (우대) LLM 추론 최적화 및 배치/캐싱 전략 경험; 머신러닝 시스템 대규모 배포 경험; 복잡한 분산 시스템 문제 해결 능력.
기술 스택
PythonRustKubernetesAWSGCPLLMDistributed SystemsAI Accelerators