zoom

Audio AI Engineer

개발AI·머신러닝연구·R&D

AI 요약

Zoom의 글로벌 오디오 팀에서 실시간 스트리밍 환경에 최적화된 음성 합성(TTS), 음성 인식(ASR), 목소리 변환 알고리즘을 연구하고 개발할 Audio AI Engineer를 채용합니다. 딥러닝 프레임워크 활용 능력과 저지연 시스템 최적화 경험이 핵심입니다.

주요 업무

- 악센트 변환, 목소리 변환, 음성 합성 및 인식 알고리즘 연구 및 개발 - 저지연 스트리밍 아키텍처 기반의 엔드투엔드 오디오 모델 프로토타이핑 및 개선 - 실시간 통신 시스템에 모델 통합 및 최적화 (품질, 지연 시간, 확장성) - 최신 음성 처리 기술 동향 파악 및 특허/지식 공유 기여

자격 요건

- 스트리밍, 악센트/목소리 변환, TTS, ASR 관련 분야 박사 학위 또는 그에 준하는 경험 - PyTorch 또는 TensorFlow 등 딥러닝 프레임워크 숙련도 - Python, C/C++ 프로그래밍 능력 - Transformer, RNN, Diffusion models, Conformer 등 시퀀스 모델링 아키텍처 이해 - 저지연 실시간 음성/오디오 모델 개발 및 배포 경험 - 모델 압축 및 가속화 기술(Quantization, Pruning, Distillation) 지식 - ICASSP, INTERSPEECH, NeurIPS, ICLR 등 주요 학회 논문 게재 경험 - 2년 이상의 관련 산업계 경력 우대

기술 스택

PyTorchTensorFlowPythonCC++TransformersRNNsDiffusion modelsConformersQuantizationPruningDistillation

AI 점수 98core

지원하기

Audio AI Engineer

AI 요약

주요 업무

자격 요건

기술 스택

zoom의 다른 공고

알림