microsoftus

Member of Technical Staff – Post Training – MAI Superintelligence Team

개발AI·머신러닝연구·R&D

AI 요약

마이크로소프트 AI의 Superintelligence 팀에서 대규모 언어 모델(LLM)의 사후 학습(Post-training)을 담당할 소프트웨어 엔지니어를 채용합니다. 보상 모델링(Reward Modeling) 및 강화학습(RL) 기술을 활용하여 모델의 추론, 코딩, 에이전트 능력을 고도화하는 핵심적인 역할을 수행합니다.

주요 업무

• 모델을 위한 데이터 수집, 평가 및 사후 학습(Post-training) 방법론 개발 • 모델 성능의 신속한 반복 개선을 위한 가설 설계 및 실험 계획 수립 • 보상 모델링 및 RL 기법을 적용하여 모델의 추론, 수학, 코딩 및 에이전트 능력 개선 • 최첨단 사전 학습 모델과 알고리즘을 활용한 기술적 한계 돌파

자격 요건

• 필수 요건: 컴퓨터 공학, 머신러닝, 수학 또는 관련 기술 분야 학사 학위 및 4년 이상의 기술 엔지니어링 경험(C, C++, C#, Java, JavaScript, Python 등 숙련). 보상 모델링(Reward Modeling), 강화학습(RL) 또는 기타 사후 학습 기술 경험 필수. • 우대 요건: 6년 이상의 엔지니어링 경험(또는 석사 학위 및 4년 이상 경험). 대규모 AI(Large-scale AI) 프로젝트 수행 경험. 대화형 AI 및 배포에 대한 열정. 제품 매니저, 디자이너 등 교차 기능 팀과의 원활한 소통 및 협업 능력.

기술 스택

PythonCC++C#JavaJavaScriptLLMReinforcement LearningRLReward ModelingPost-trainingNLP

AI 점수 100core

지원하기

Member of Technical Staff – Post Training – MAI Superintelligence Team

AI 요약

주요 업무

자격 요건

기술 스택

microsoftus의 다른 공고

알림