
microsoftus
Member of Technical Staff – Pretraining Text Data
개발AI·머신러닝데이터연구·R&D
AI 요약
Microsoft AI의 Superintelligence 팀에서 차세대 파운데이션 LLM 구축을 위한 프리트레이닝 텍스트 데이터 엔지니어 및 연구원을 채용합니다. 고품질 데이터셋 큐레이션, 확장 가능한 데이터 파이프라인 개발, 데이터 기반 모델 행동 분석 등을 통해 인류의 잠재력을 증폭시키는 안전하고 통제 가능한 AI 개발에 기여하게 됩니다.
주요 업무
차세대 파운데이션 LLM 학습 및 평가를 위한 고품질 데이터셋 구축 및 데이터 영향력 평가 실험 수행. 텍스트 데이터 수집, 전처리, 필터링, 어노테이션을 위한 확장 가능한 데이터 파이프라인 개발 및 유지보수. 데이터 품질, 다양성, 관련성 분석 및 개선점 식별. 데이터셋 감사, 시각화, 버전 관리를 위한 도구 및 워크플로우 구축. 안전, 윤리, 거버넌스 팀과 협력하여 책임 있는 AI 표준 준수.
자격 요건
학사 학위 이상(AI, 컴퓨터 공학, 데이터 사이언스, 통계학, 물리학 등 관련 전공) 및 4년 이상의 기술 엔지니어링 경력 필수. Python 및 주요 데이터 라이브러리(Pandas, NumPy 등) 활용 능력 필수. 2년 이상의 대규모 비정형/반정형 데이터 분석 또는 데이터 엔지니어링 경험 우대. 통계 및 탐색적 데이터 분석(EDA) 능숙도 요구. Spark, Ray, Apache Beam 등 데이터 처리 프레임워크 경험 우대. 석사(8년 이상 경력) 또는 학사(12년 이상 경력) 수준의 시니어급 역량 선호.
기술 스택
PythonPandasNumPySparkRayApache Beam
microsoftus의 다른 공고
Senior Applied Scientist
AI·머신러닝, 데이터, 연구·R&DApplied Science: Microsoft AI Internship Opportunities – Redmond
AI·머신러닝, 데이터, 연구·R&DSenior Data Scientist – LLM Evaluation
데이터, AI·머신러닝, 연구·R&DPrincipal Data Scientist – MSN & Copilot Discover Business Analytics team
데이터, AI·머신러닝Applied Scientist II
AI·머신러닝, 데이터, 연구·R&DPrincipal Applied Scientist
AI·머신러닝, 연구·R&DApplied Science: PhD Microsoft AI Internship Opportunities – Redmond
AI·머신러닝, 연구·R&D, 데이터Senior Data & Applied Scientist – Global Skilling Data Science Team
데이터, 연구·R&D