Jobs
together 로고

together

Senior Machine Learning Engineer, Voice AI

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

Together AI에서 음성 AI 플랫폼의 모델 서빙 레이어를 최적화할 시니어 머신러닝 엔지니어를 채용합니다. STT, TTS 및 실시간 음성 대화 모델의 추론 성능을 극대화하고, 최신 GPU 자원을 활용하여 고성능 인프라를 구축하는 역할을 수행합니다.

주요 업무

음성 모델(STT, TTS, Speech-to-Speech) 추론 성능 최적화(TTFB, 처리량, GPU 활용도 개선), 서버리스 및 전용 엔드포인트에서의 음성 모델 프로덕션화(배칭 전략, 스트리밍 추론, 메모리 관리), 음성 모델 평가 프레임워크 구축 및 유지보수(WER, 자연스러움, 지연 시간 측정), 최신 모델 아키텍처(Audio-native LLM, Codec 기반 모델 등) 서빙 스택 통합, 파트너사(Cartesia, Deepgram 등) 모델 최적화 및 통합, GPU 커널부터 프레임워크 레벨까지 전체 인프라 스택의 성능 디버깅, 실시간 음성 API의 지연 시간 및 신뢰성 요구사항 충족을 위한 플랫폼 엔지니어링 협업.

자격 요건

5년 이상의 ML 엔지니어링 경험(모델 서빙, 추론 최적화 또는 ML 인프라 중심), LLM 서빙 엔진(vLLM, SGLang, TensorRT-LLM 등) 실무 경험 및 내부 구조 수정 가능자, Python 및 PyTorch 숙련도, GPU 프로파일링 및 최적화(CUDA, 메모리 관리, 커널 수준 디버깅) 능력, ML 시스템의 프로덕션 배포 및 성능 개선 경험, 음성 및 오디오 ML(ASR, TTS 아키텍처, 오디오 신호 처리) 경험 우대, 오디오 코덱 및 토큰화 스키마(SNAC, Encodec, DAC) 이해 우대, 음성 모델 파인튜닝 경험 우대, 컴퓨터 공학 또는 관련 분야 학위 소지자.

기술 스택

PythonPyTorchTensorRT-LLMSGLangvLLMCUDAWhisperParakeetOrpheusKokoroSNACEncodecDACH100H200B200
AI 점수 98core

together의 다른 공고

알림

알림이 없습니다