Jobs
microsoftus 로고

microsoftus

Research Intern – AI/ML Numerics & Efficiency

AI·머신러닝연구·R&D하드웨어·임베디드

AI 요약

Microsoft Research의 SPARC 그룹에서 차세대 AI 워크로드를 위한 ML 시스템 연구 인턴을 모집합니다. 석/박사 과정생을 대상으로 하며, 모델 효율성, 양자화, 커널 최적화 및 클라우드 규모의 AI 인프라 설계를 연구합니다. Python, C++, GPU 프로그래밍 역량이 필수적입니다.

주요 업무

차세대 AI 워크로드를 위한 ML 시스템 연구 및 탐색, 저정밀도 포맷 및 양자화 전략을 통한 모델 효율성 조사, ML 커널 개발 및 벤치마킹, 대규모 모델의 학습 및 추론 성능/비용 개선을 위한 알고리즘 프로토타이핑, 클라우드 규모의 AI 인프라 및 하드웨어 가속 전략 수립 지원.

자격 요건

현재 컴퓨터 공학, 전기 공학 또는 관련 STEM 분야의 석사 또는 박사 과정에 재학 중이어야 하며, 머신러닝 시스템과 관련된 최소 2개의 학술 과목 또는 프로젝트를 완료해야 합니다. 또한 Python, C++ 또는 유사한 시스템 지향 언어를 사용한 3년 이상의 프로그래밍 경험이 필수입니다. 우대 사항으로는 오픈소스 ML 프레임워크 기여 경험, Transformer 아키텍처(Attention, KV 캐시 등)에 대한 깊은 이해, PyTorch, Hugging Face, vLLM, TensorRT-LLM 등 현대적 ML 프레임워크 사용 경험, CUDA 또는 Triton을 이용한 GPU 가속기 프로그래밍 및 프로파일링 능력이 포함됩니다. 저정밀도 수치 체계, 양자화 방법론 또는 하드웨어-소프트웨어 공동 설계에 대한 지식도 선호됩니다.

기술 스택

PythonC++PyTorchHugging Face TransformersSGLangvLLMTensorRT-LLMCUDATriton
AI 점수 95core

microsoftus의 다른 공고

알림

알림이 없습니다