anthropic

Research Engineer, Production Model Post Training

개발AI·머신러닝연구·R&D

AI 요약

앤스로픽(Anthropic)의 Post-Training 팀에서 클로드(Claude) 모델의 성능, 정렬 및 안전성을 고도화할 리서치 엔지니어를 채용합니다. 대규모 분산 시스템 환경에서 RLHF, Constitutional AI 등 최신 정렬 기술을 구현하고 최적화하여 모델의 품질을 결정짓는 핵심 역할을 수행합니다.

주요 업무

최첨단 모델의 포스트 트레이닝 기술(Constitutional AI, RLHF 등) 구현 및 최적화, 효율적인 모델 미세 조정 및 평가 파이프라인 설계/운영, 모델 성능 측정 및 개선 도구 개발, 연구팀의 최신 기법을 프로덕션 환경에 적용, 학습 파이프라인 및 모델 동작의 복잡한 이슈 디버깅, 신뢰할 수 있는 모델 학습을 위한 베스트 프랙티스 수립.

자격 요건

관련 분야 학사 학위 이상 또는 그에 준하는 경험, 복잡한 ML 시스템 구축 경험 및 강력한 소프트웨어 엔지니어링 기술, 대규모 분산 시스템 및 고성능 컴퓨팅(HPC) 숙련도, LLM 학습/미세 조정/평가 경험, Python 및 딥러닝 프레임워크(PyTorch 등) 능숙도, AI 안전 및 책임 있는 배포에 대한 깊은 관심, 모호한 연구 환경에서의 문제 해결 능력.

기술 스택

PythonDeep Learning FrameworksDistributed ComputingLLMRLHFConstitutional AIFine-tuningHPC

AI 점수 100core

지원하기

Research Engineer, Production Model Post Training

AI 요약

주요 업무

자격 요건

기술 스택

anthropic의 다른 공고

알림