
together
Research Intern, Inference (Fall 2026)
AI·머신러닝연구·R&D개발인프라·DevOps
AI 요약
Together AI의 Inference Research 팀 인턴 채용으로, 대규모 foundation model의 효율적·확장 가능한 서빙 시스템을 연구/구현하는 역할입니다. 분산 추론, 컴파일러 인지 최적화, speculative decoding, KV cache 설계, 대규모 serving architecture 등 모델·시스템·하드웨어를 아우르는 cross-layer 최적화가 핵심입니다.
주요 업무
분산 추론 및 추론 시점 최적화 연구, 컴파일러 인지 최적화와 speculative decoding/phase-aware execution 등 신규 추론 전략 탐구, 모델·시스템·하드웨어를 아우르는 cross-layer 최적화 설계 및 구현, KV cache 및 대규모 serving architecture 관련 프로젝트 수행, 가설 검증을 위한 엄밀한 실험 설계 및 수행, 진행 상황/결과를 팀에 공유, 연구 결과를 논문 및 블로그로 문서화
자격 요건
필수: CS, Electrical Engineering 또는 관련 분야의 학부 마지막 학년/석사/박사 재학 중인 자, Machine Learning 및 Deep Learning 기초 지식, PyTorch/JAX 등 딥러닝 프레임워크 경험, Python 프로그래밍 역량, Transformer 구조 및 foundation model 최신 동향 이해. 우대: foundation models/efficient machine learning/ML systems 연구 경험, MLSys/ICLR 등 주요 학회 논문 발표 경험, CUDA 프로그래밍 경험, 모델 최적화 및 하드웨어 가속 이해, 오픈소스 ML 프로젝트 기여 경험.
기술 스택
PythonPyTorchJAXCUDATransformerMachine LearningDeep Learningfoundation modelsMixture-of-ExpertsKV cache
together의 다른 공고
Head of Hyperscaler Partnerships
영업Software Engineer(Amsterdam)
개발Product Manager, AI Infrastructure
제품·기획·디자인Research Intern RL & Post-Training Systems, Turbo (Fall 2026)
연구·R&D, AI·머신러닝Workplace Coordinator
경영지원, 현장운영Senior Software Engineer(Amsterdam)
개발, 보안Research Intern, Model Shaping (Fall 2026)
AI·머신러닝, 연구·R&DSystems Research Engineer Intern - GPU Programming (Fall 2026)
AI·머신러닝, 연구·R&D, 하드웨어·임베디드