together

Machine Learning Engineer - Inference

개발AI·머신러닝연구·R&D

AI 요약

Together AI에서 대규모 언어 모델(LLM)의 추론 성능을 최적화하고 고성능 시스템을 구축할 머신러닝 엔지니어를 채용합니다. Python과 PyTorch 숙련도가 필수이며, 저수준 시스템 프로그래밍 및 최신 AI 추론 기술에 대한 깊은 이해가 요구됩니다.

주요 업무

Together AI 추론 엔진의 생산 시스템 설계 및 구축, 대규모 AI 애플리케이션을 위한 런타임 추론 서비스 개발 및 최적화, 연구원·PM·디자이너와 협업하여 새로운 기능 구현, 코드 리뷰 및 품질 관리, 추론 엔진 지원을 위한 도구 및 개발자 문서 작성, 데이터 수집 및 처리를 위한 견고한 시스템 구현.

자격 요건

3년 이상의 고성능 프로덕션 품질 코드 작성 경험, Python 및 PyTorch 숙련도, 고성능 라이브러리 및 도구 구축 경험, 저수준 운영체제 개념(멀티스레딩, 메모리 관리, 네트워킹, 스토리지, 성능 및 확장성)에 대한 탁월한 이해. (우대) TGI, vLLM, TensorRT-LLM, Optimum 등 AI 추론 시스템 지식, Speculative decoding 등 추론 기술 지식, CUDA/Triton 프로그래밍 지식, Rust, Cython 및 컴파일러 관련 지식.

기술 스택

PythonPyTorchTGIvLLMTensorRT-LLMOptimumCUDATritonRustCython

AI 점수 98core

지원하기

Machine Learning Engineer - Inference

AI 요약

주요 업무

자격 요건

기술 스택

together의 다른 공고

알림