anthropic

Machine Learning Systems Engineer, RL Engineering

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

Anthropic에서 Claude와 같은 대규모 언어 모델(LLM)의 학습을 위한 강화학습(RL) 시스템 및 인프라를 구축하고 개선할 ML 시스템 엔지니어를 채용합니다. 연구원들이 효율적으로 모델을 학습시킬 수 있도록 알고리즘 성능 최적화와 대규모 분산 시스템 관리를 담당합니다.

주요 업무

- Claude 및 내부 연구 모델 학습을 위한 RLHF 알고리즘 및 시스템 구축/유지보수 - 강화학습 파이프라인 프로파일링 및 성능 최적화 기회 발굴 - 학습 파이프라인 문제 감지를 위한 테스트 환경 및 자동화 시스템 구축 - 새로운 모델 아키텍처에 대응하는 파인튜닝 시스템 수정 - Python GIL 경합 감지 및 제거를 위한 인스트루멘테이션 구축 - 연구자가 제안한 새로운 학습 알고리즘의 안정적이고 빠른 버전 구현

자격 요건

- 4년 이상의 소프트웨어 엔지니어링 경험 - 타인의 생산성을 높이는 시스템 및 도구 구축 선호 - 결과 중심적이며 유연한 사고방식 및 임팩트 중시 - 페어 프로그래밍 선호 및 머신러닝 연구에 대한 학습 의지 - 관련 분야 학사 학위 또는 그에 준하는 경험 - (우대) 고성능 대규모 분산 시스템 경험 - (우대) 대규모 LLM 학습 경험 - (우대) Python 숙련도 - (우대) RLHF 등 LLM 파인튜닝 알고리즘 구현 경험

기술 스택

PythonMLLLMRLHFReinforcement LearningDistributed Systems

AI 점수 100core

지원하기

Machine Learning Systems Engineer, RL Engineering

AI 요약

주요 업무

자격 요건

기술 스택

anthropic의 다른 공고

알림