
anthropic
Staff + Senior Software Engineer, Inference
개발인프라·DevOps연구·R&D
AI 요약
Anthropic의 Inference 팀에서 Claude를 수백만 사용자에게 안정적으로 제공할 분산시스템 엔지니어를 채용합니다. 대규모 요청 라우팅, 로드밸런싱, 오토스케일링, 배포 파이프라인 운영, AI 가속기 통합, 관측성 기반 성능 최적화가 핵심이며, 분산시스템 경험과 머신러닝 시스템 인프라 이해가 중요합니다.
주요 업무
Claude를 수백만 사용자에게 제공하는 분산시스템 설계·구축·운영, 수천 개 가속기 전반의 intelligent request routing·load balancing·traffic management 개발, production/research/experimental workload 오토스케일링 및 오케스트레이션, 신규 모델 배포를 위한 production-grade deployment pipeline 구축, 차세대 모델 개발을 지원하는 고성능 inference infrastructure 제공, 새로운 AI accelerator platform 및 모델 아키텍처 통합, observability data를 활용한 성능 튜닝, 멀티리전 배포 및 지리적 라우팅 관리.
자격 요건
필수: 분산시스템 중심의 상당한 소프트웨어 엔지니어링 경험, 유연성과 임팩트 지향성, 직무 범위를 넘어서는 업무도 기꺼이 수행하는 태도, 페어 프로그래밍 선호, 머신러닝 시스템 및 인프라 학습 의지, 기술적 우수성이 비즈니스 성과와 연구 성과에 직접 연결되는 환경에서의 역량, 사회적 영향에 대한 관심. 우대: 대규모 고성능 분산시스템 경험, 머신러닝 시스템의 대규모 배포 경험, load balancing/request routing/traffic management 경험, LLM inference optimization·batching·caching 이해, Kubernetes 및 cloud infrastructure(AWS, GCP, Azure) 경험, Python 또는 Rust 숙련도.
기술 스택
PythonRustKubernetesAWSGCPAzure