
anthropic
Research Engineer, Production Model Post Training
개발AI·머신러닝연구·R&D
AI 요약
Anthropic의 Post-Training 팀에서 Claude 모델의 성능, 정렬 및 안전성을 고도화할 Research Engineer를 채용합니다. Constitutional AI 및 RLHF와 같은 최첨단 기법을 대규모 시스템에 구현하고 최적화하여 실제 서비스되는 모델의 품질을 결정짓는 핵심적인 역할을 수행합니다.
주요 업무
- 프론티어 모델에 대한 사후 학습(Post-Training) 기술 구현 및 대규모 최적화
- 프로덕션 모델 품질 향상을 위한 학습 레시피 연구 및 개발
- 모델 미세 조정 및 평가를 위한 견고하고 효율적인 파이프라인 설계 및 운영
- 다양한 차원에서 모델 성능을 측정하고 개선하기 위한 도구 개발
- 연구팀과 협력하여 최신 연구 성과를 프로덕션 환경에 적용
- 학습 파이프라인 및 모델 동작의 복잡한 이슈 디버깅
자격 요건
- 관련 분야 학사 학위 이상 또는 그에 준하는 실무 경험
- Python 프로그래밍 및 딥러닝 프레임워크(Deep learning frameworks) 숙련도
- 대규모 분산 시스템 및 고성능 컴퓨팅(HPC) 환경에서의 작업 경험
- 대규모 언어 모델(LLM)의 학습, 미세 조정(Fine-tuning) 또는 평가 경험
- 복잡한 ML 시스템 구축 및 디버깅 능력
- 연구 기법을 프로덕션 수준의 구현으로 전환할 수 있는 역량
- (우대) 프론티어 AI 시스템에 대한 직접적인 경험이 있는 시니어 엔지니어
- (우대) AI 안전 및 책임 있는 배포에 대한 깊은 관심
기술 스택
PythonLLMRLHFConstitutional AIDeep Learning FrameworksDistributed SystemsHigh-Performance Computing (HPC)MLOps