Jobs
together 로고

together

Staff Platform Engineer, Voice AI

개발인프라·DevOps

AI 요약

Together AI에서 실시간 음성 AI 플랫폼의 아키텍처와 확장성을 책임질 Staff Platform Engineer를 채용합니다. 대규모 분산 시스템 설계 및 실시간 스트리밍 인프라 구축 경험을 바탕으로, 지연 시간을 최소화하는 API 레이어와 GPU 오토스케일링 시스템을 설계하고 ML 서빙 스택과의 인터페이스를 조율하는 역할을 수행합니다.

주요 업무

- 실시간 STT/TTS 서비스를 위한 WebSocket 및 HTTP 스트리밍 API 레이어의 아키처 및 신뢰성 설계 - 수만 개의 GPU에서 실시간 트래픽을 처리하기 위한 지연 시간 민감형 오토스케일링 아키텍처 설계 및 구현 - 단어 수준 정렬, 실시간 화자 분할(Diarization), 오디오 포맷 지원 등 음성 API 기능 정의 및 아키텍처 결정 - 지연 시간 분석 파이프라인, 오디오 품질 신호 수집 등 음성 인프라용 관측 가능성(Observability) 플랫폼 구축 - 다양한 모델 파트너(Cartesia, Deepgram, Rime 등)를 통합하는 일관된 다중 제공자 추상화 레이어 설계 - ML 엔지니어링 팀과 협업하여 API 레이어와 모델 서빙 스택 간의 인터페이스 정의 및 최적화 - API 디자인 리뷰 주도, 문서화 전략 수립 등을 통한 개발자 경험(DX) 향상

자격 요건

[필수 요건] - 대규모 실시간 분산 시스템 구축 및 운영 경험 8년 이상 - 실시간 스트리밍 인프라(WebSocket, SSE, 양방향 스트리밍, 상태 유지 프로토콜 설계)에 대한 깊은 전문성 - TypeScript 및 Python 전문가 수준의 역량 및 시스템 레벨 사고 능력 - 지연 시간에 민감한 워크로드를 위한 로드 밸런싱, 오토스케일링, 속도 제한(Rate Limiting) 등 분산 시스템 설계 능력 - Kubernetes 전문성 (커스텀 오토스케일러, 리소스 관리, 상태 유지 스트리밍 서비스 헬스 체크 등) - 주도적으로 방향을 설정하고 모호한 문제를 해결하는 강력한 기술 리더십 - 개발자 플랫폼 및 API 설계에 대한 뛰어난 직관 [우대 요건] - Rust 경험 (음성 인프라 개발에 유리) - 오디오 및 미디어 프로토콜(WebRTC, g711, PCM 인코딩) 경험 - ML 모델 서빙 인프라 및 추론 엔진 작동 방식에 대한 이해 - 개발자 도구 기여를 위한 풀스택(React, Next.js) 개발 경험 - 컴퓨터공학 또는 관련 분야 학사/석사 학위 (또는 이에 준하는 실무 경력)

기술 스택

TypeScriptPythonRustKubernetesWebSocketSSEWebRTCg711PCMReactNext.js
AI 점수 85core

together의 다른 공고

알림

알림이 없습니다