
together
Machine Learning Engineer - Inference
개발AI·머신러닝연구·R&D
AI 요약
Together AI에서 대규모 언어 모델(LLM)의 추론 성능을 최적화하고 고성능 시스템을 구축할 머신러닝 엔지니어를 채용합니다. Python과 PyTorch 숙련도가 필수이며, 저수준 시스템 프로그래밍 및 최신 AI 추론 기술에 대한 깊은 이해가 요구됩니다.
주요 업무
Together AI 추론 엔진의 생산 시스템 설계 및 구축, 대규모 AI 애플리케이션을 위한 런타임 추론 서비스 개발 및 최적화, 연구원·PM·디자이너와 협업하여 새로운 기능 구현, 코드 리뷰 및 품질 관리, 추론 엔진 지원을 위한 도구 및 개발자 문서 작성, 데이터 수집 및 처리를 위한 견고한 시스템 구현.
자격 요건
3년 이상의 고성능 프로덕션 품질 코드 작성 경험, Python 및 PyTorch 숙련도, 고성능 라이브러리 및 도구 구축 경험, 저수준 운영체제 개념(멀티스레딩, 메모리 관리, 네트워킹, 스토리지, 성능 및 확장성)에 대한 탁월한 이해. (우대) TGI, vLLM, TensorRT-LLM, Optimum 등 AI 추론 시스템 지식, Speculative decoding 등 추론 기술 지식, CUDA/Triton 프로그래밍 지식, Rust, Cython 및 컴파일러 관련 지식.
기술 스택
PythonPyTorchTGIvLLMTensorRT-LLMOptimumCUDATritonRustCython
together의 다른 공고
Head of Hyperscaler Partnerships
영업Software Engineer(Amsterdam)
개발Product Manager, AI Infrastructure
제품·기획·디자인Research Intern RL & Post-Training Systems, Turbo (Fall 2026)
연구·R&D, AI·머신러닝Workplace Coordinator
경영지원, 현장운영Senior Software Engineer(Amsterdam)
개발, 보안Research Intern, Model Shaping (Fall 2026)
AI·머신러닝, 연구·R&DResearch Intern, Inference (Fall 2026)
AI·머신러닝, 연구·R&D, 개발, 인프라·DevOps