
together
Research Engineer, Core ML
개발AI·머신러닝연구·R&D
AI 요약
Together AI의 Core ML (Turbo) 팀에서 추론 효율성 개선과 강화학습(RL) 기반 사후 학습 시스템을 구축할 리서치 엔지니어를 채용합니다. 알고리즘과 시스템의 접점에서 대규모 모델의 성능을 최적화하고 실제 프로덕션에 적용하는 역할을 수행하며, 최신 RL 알고리즘을 고성능 인프라로 변환하는 데 집중합니다.
주요 업무
저지연/고처리량 추론을 위한 알고리즘, 아키텍처 및 스케줄링 전략 설계; 고성능 추론 엔진(vLLM, SGLang 등) 및 커널 백엔드 구현 및 유지보수; RL 및 사후 학습 파이프라인(RLHF, RLAIF, GRPO, DPO 등) 설계 및 운영; 추론 인지형 학습 루프를 통한 워크로드 효율화; GPU, 네트워킹, 메모리 계층 전반의 성능 프로파일링 및 최적화; 연구 아이디어를 안정적이고 측정 가능한 프로덕션 시스템으로 전환.
자격 요건
ML 시스템, 대규모 모델 학습, 추론 또는 인접 분야 3년 이상 경력; 컴퓨터공학, 전기공학(EE) 또는 관련 분야 석박사 학위 혹은 그에 준하는 실무 경험; Python 프로그래밍 및 GPU/네트워크/메모리 성능 최적화 능력; 대규모 추론 시스템(vLLM, SGLang, FasterTransformer 등) 또는 RL/사후 학습(GRPO, RLHF, DPO 등)에 대한 깊은 전문성; 복잡한 기술 프로젝트의 엔드투엔드 소유 및 구현 경험; 최신 논문을 읽고 시스템에 적용할 수 있는 연구 기초 역량.
기술 스택
PythonRLRLHFRLAIFGRPODPOvLLMSGLangATLASTransformersGPUCUDAFlashAttentionHyenaFlexGenRedPajamaQuantizationSpeculative Decoding
together의 다른 공고
Head of Hyperscaler Partnerships
영업Software Engineer(Amsterdam)
개발Product Manager, AI Infrastructure
제품·기획·디자인Research Intern RL & Post-Training Systems, Turbo (Fall 2026)
연구·R&D, AI·머신러닝Workplace Coordinator
경영지원, 현장운영Senior Software Engineer(Amsterdam)
개발, 보안Research Intern, Model Shaping (Fall 2026)
AI·머신러닝, 연구·R&DResearch Intern, Inference (Fall 2026)
AI·머신러닝, 연구·R&D, 개발, 인프라·DevOps