Jobs
anthropic 로고

anthropic

Machine Learning Systems Engineer, RL Engineering

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

Anthropic에서 Claude와 같은 대규모 언어 모델(LLM)의 학습을 위한 강화학습(RL) 시스템 및 인프라를 구축하고 개선할 ML 시스템 엔지니어를 채용합니다. 연구원들이 효율적으로 모델을 학습시킬 수 있도록 알고리즘 성능 최적화와 대규모 분산 시스템 관리를 담당합니다.

주요 업무

- Claude 및 내부 연구 모델 학습을 위한 RLHF 알고리즘 및 시스템 구축/유지보수 - 강화학습 파이프라인 프로파일링 및 성능 최적화 기회 발굴 - 학습 파이프라인 문제 감지를 위한 테스트 환경 및 자동화 시스템 구축 - 새로운 모델 아키텍처에 대응하는 파인튜닝 시스템 수정 - Python GIL 경합 감지 및 제거를 위한 인스트루멘테이션 구축 - 연구자가 제안한 새로운 학습 알고리즘의 안정적이고 빠른 버전 구현

자격 요건

- 4년 이상의 소프트웨어 엔지니어링 경험 - 타인의 생산성을 높이는 시스템 및 도구 구축 선호 - 결과 중심적이며 유연한 사고방식 및 임팩트 중시 - 페어 프로그래밍 선호 및 머신러닝 연구에 대한 학습 의지 - 관련 분야 학사 학위 또는 그에 준하는 경험 - (우대) 고성능 대규모 분산 시스템 경험 - (우대) 대규모 LLM 학습 경험 - (우대) Python 숙련도 - (우대) RLHF 등 LLM 파인튜닝 알고리즘 구현 경험

기술 스택

PythonMLLLMRLHFReinforcement LearningDistributed Systems
AI 점수 100core

anthropic의 다른 공고

알림

알림이 없습니다