
together
Staff Platform Engineer, Voice AI
개발인프라·DevOps
AI 요약
Together AI에서 실시간 음성 AI 플랫폼의 아키텍처와 확장성을 책임질 Staff Platform Engineer를 채용합니다. 대규모 분산 시스템 설계 및 실시간 스트리밍 인프라 구축 경험을 바탕으로, 지연 시간을 최소화하는 API 레이어와 GPU 오토스케일링 시스템을 설계하고 ML 서빙 스택과의 인터페이스를 조율하는 역할을 수행합니다.
주요 업무
- 실시간 STT/TTS 서비스를 위한 WebSocket 및 HTTP 스트리밍 API 레이어의 아키처 및 신뢰성 설계
- 수만 개의 GPU에서 실시간 트래픽을 처리하기 위한 지연 시간 민감형 오토스케일링 아키텍처 설계 및 구현
- 단어 수준 정렬, 실시간 화자 분할(Diarization), 오디오 포맷 지원 등 음성 API 기능 정의 및 아키텍처 결정
- 지연 시간 분석 파이프라인, 오디오 품질 신호 수집 등 음성 인프라용 관측 가능성(Observability) 플랫폼 구축
- 다양한 모델 파트너(Cartesia, Deepgram, Rime 등)를 통합하는 일관된 다중 제공자 추상화 레이어 설계
- ML 엔지니어링 팀과 협업하여 API 레이어와 모델 서빙 스택 간의 인터페이스 정의 및 최적화
- API 디자인 리뷰 주도, 문서화 전략 수립 등을 통한 개발자 경험(DX) 향상
자격 요건
[필수 요건]
- 대규모 실시간 분산 시스템 구축 및 운영 경험 8년 이상
- 실시간 스트리밍 인프라(WebSocket, SSE, 양방향 스트리밍, 상태 유지 프로토콜 설계)에 대한 깊은 전문성
- TypeScript 및 Python 전문가 수준의 역량 및 시스템 레벨 사고 능력
- 지연 시간에 민감한 워크로드를 위한 로드 밸런싱, 오토스케일링, 속도 제한(Rate Limiting) 등 분산 시스템 설계 능력
- Kubernetes 전문성 (커스텀 오토스케일러, 리소스 관리, 상태 유지 스트리밍 서비스 헬스 체크 등)
- 주도적으로 방향을 설정하고 모호한 문제를 해결하는 강력한 기술 리더십
- 개발자 플랫폼 및 API 설계에 대한 뛰어난 직관
[우대 요건]
- Rust 경험 (음성 인프라 개발에 유리)
- 오디오 및 미디어 프로토콜(WebRTC, g711, PCM 인코딩) 경험
- ML 모델 서빙 인프라 및 추론 엔진 작동 방식에 대한 이해
- 개발자 도구 기여를 위한 풀스택(React, Next.js) 개발 경험
- 컴퓨터공학 또는 관련 분야 학사/석사 학위 (또는 이에 준하는 실무 경력)
기술 스택
TypeScriptPythonRustKubernetesWebSocketSSEWebRTCg711PCMReactNext.js
together의 다른 공고
Head of Hyperscaler Partnerships
영업Software Engineer(Amsterdam)
개발Product Manager, AI Infrastructure
제품·기획·디자인Research Intern RL & Post-Training Systems, Turbo (Fall 2026)
연구·R&D, AI·머신러닝Workplace Coordinator
경영지원, 현장운영Senior Software Engineer(Amsterdam)
개발, 보안Research Intern, Model Shaping (Fall 2026)
AI·머신러닝, 연구·R&DFrontier Agents Intern (Fall 2026)
AI·머신러닝, 연구·R&D