Jobs
microsoftus 로고

microsoftus

Member of Technical Staff – Pretraining Text Data

개발AI·머신러닝데이터연구·R&D

AI 요약

Microsoft AI의 Superintelligence 팀에서 차세대 파운데이션 LLM 구축을 위한 프리트레이닝 텍스트 데이터 엔지니어 및 연구원을 채용합니다. 고품질 데이터셋 큐레이션, 확장 가능한 데이터 파이프라인 개발, 데이터 기반 모델 행동 분석 등을 통해 인류의 잠재력을 증폭시키는 안전하고 통제 가능한 AI 개발에 기여하게 됩니다.

주요 업무

차세대 파운데이션 LLM 학습 및 평가를 위한 고품질 데이터셋 구축 및 데이터 영향력 평가 실험 수행. 텍스트 데이터 수집, 전처리, 필터링, 어노테이션을 위한 확장 가능한 데이터 파이프라인 개발 및 유지보수. 데이터 품질, 다양성, 관련성 분석 및 개선점 식별. 데이터셋 감사, 시각화, 버전 관리를 위한 도구 및 워크플로우 구축. 안전, 윤리, 거버넌스 팀과 협력하여 책임 있는 AI 표준 준수.

자격 요건

학사 학위 이상(AI, 컴퓨터 공학, 데이터 사이언스, 통계학, 물리학 등 관련 전공) 및 4년 이상의 기술 엔지니어링 경력 필수. Python 및 주요 데이터 라이브러리(Pandas, NumPy 등) 활용 능력 필수. 2년 이상의 대규모 비정형/반정형 데이터 분석 또는 데이터 엔지니어링 경험 우대. 통계 및 탐색적 데이터 분석(EDA) 능숙도 요구. Spark, Ray, Apache Beam 등 데이터 처리 프레임워크 경험 우대. 석사(8년 이상 경력) 또는 학사(12년 이상 경력) 수준의 시니어급 역량 선호.

기술 스택

PythonPandasNumPySparkRayApache Beam
AI 점수 95core

microsoftus의 다른 공고

알림

알림이 없습니다