together

Research Intern, Inference (Fall 2026)

AI·머신러닝연구·R&D개발인프라·DevOps

AI 요약

Together AI의 Inference Research 팀 인턴 채용으로, 대규모 foundation model의 효율적·확장 가능한 서빙 시스템을 연구/구현하는 역할입니다. 분산 추론, 컴파일러 인지 최적화, speculative decoding, KV cache 설계, 대규모 serving architecture 등 모델·시스템·하드웨어를 아우르는 cross-layer 최적화가 핵심입니다.

주요 업무

분산 추론 및 추론 시점 최적화 연구, 컴파일러 인지 최적화와 speculative decoding/phase-aware execution 등 신규 추론 전략 탐구, 모델·시스템·하드웨어를 아우르는 cross-layer 최적화 설계 및 구현, KV cache 및 대규모 serving architecture 관련 프로젝트 수행, 가설 검증을 위한 엄밀한 실험 설계 및 수행, 진행 상황/결과를 팀에 공유, 연구 결과를 논문 및 블로그로 문서화

자격 요건

필수: CS, Electrical Engineering 또는 관련 분야의 학부 마지막 학년/석사/박사 재학 중인 자, Machine Learning 및 Deep Learning 기초 지식, PyTorch/JAX 등 딥러닝 프레임워크 경험, Python 프로그래밍 역량, Transformer 구조 및 foundation model 최신 동향 이해. 우대: foundation models/efficient machine learning/ML systems 연구 경험, MLSys/ICLR 등 주요 학회 논문 발표 경험, CUDA 프로그래밍 경험, 모델 최적화 및 하드웨어 가속 이해, 오픈소스 ML 프로젝트 기여 경험.

기술 스택

PythonPyTorchJAXCUDATransformerMachine LearningDeep Learningfoundation modelsMixture-of-ExpertsKV cache

AI 점수 98core

지원하기

Research Intern, Inference (Fall 2026)

AI 요약

주요 업무

자격 요건

기술 스택

together의 다른 공고

알림