
microsoftus
Member of Technical Staff – Post Training – MAI Superintelligence Team
개발AI·머신러닝연구·R&D
AI 요약
마이크로소프트 AI의 Superintelligence 팀에서 대규모 언어 모델(LLM)의 사후 학습(Post-training)을 담당할 소프트웨어 엔지니어를 채용합니다. 보상 모델링(Reward Modeling) 및 강화학습(RL) 기술을 활용하여 모델의 추론, 코딩, 에이전트 능력을 고도화하는 핵심적인 역할을 수행합니다.
주요 업무
• 모델을 위한 데이터 수집, 평가 및 사후 학습(Post-training) 방법론 개발
• 모델 성능의 신속한 반복 개선을 위한 가설 설계 및 실험 계획 수립
• 보상 모델링 및 RL 기법을 적용하여 모델의 추론, 수학, 코딩 및 에이전트 능력 개선
• 최첨단 사전 학습 모델과 알고리즘을 활용한 기술적 한계 돌파
자격 요건
• 필수 요건: 컴퓨터 공학, 머신러닝, 수학 또는 관련 기술 분야 학사 학위 및 4년 이상의 기술 엔지니어링 경험(C, C++, C#, Java, JavaScript, Python 등 숙련). 보상 모델링(Reward Modeling), 강화학습(RL) 또는 기타 사후 학습 기술 경험 필수.
• 우대 요건: 6년 이상의 엔지니어링 경험(또는 석사 학위 및 4년 이상 경험). 대규모 AI(Large-scale AI) 프로젝트 수행 경험. 대화형 AI 및 배포에 대한 열정. 제품 매니저, 디자이너 등 교차 기능 팀과의 원활한 소통 및 협업 능력.
기술 스택
PythonCC++C#JavaJavaScriptLLMReinforcement LearningRLReward ModelingPost-trainingNLP
microsoftus의 다른 공고
Senior Applied Scientist
AI·머신러닝, 데이터, 연구·R&DApplied Science: Microsoft AI Internship Opportunities – Redmond
AI·머신러닝, 데이터, 연구·R&DSenior Data Scientist – LLM Evaluation
데이터, AI·머신러닝, 연구·R&DPrincipal Data Scientist – MSN & Copilot Discover Business Analytics team
데이터, AI·머신러닝Applied Scientist II
AI·머신러닝, 데이터, 연구·R&DPrincipal Applied Scientist
AI·머신러닝, 연구·R&DApplied Science: PhD Microsoft AI Internship Opportunities – Redmond
AI·머신러닝, 연구·R&D, 데이터Senior Data & Applied Scientist – Global Skilling Data Science Team
데이터, 연구·R&D