
zoom
Audio AI Engineer
개발AI·머신러닝연구·R&D
AI 요약
Zoom의 글로벌 오디오 팀에서 실시간 스트리밍 환경에 최적화된 음성 합성(TTS), 음성 인식(ASR), 목소리 변환 알고리즘을 연구하고 개발할 Audio AI Engineer를 채용합니다. 딥러닝 프레임워크 활용 능력과 저지연 시스템 최적화 경험이 핵심입니다.
주요 업무
- 악센트 변환, 목소리 변환, 음성 합성 및 인식 알고리즘 연구 및 개발
- 저지연 스트리밍 아키텍처 기반의 엔드투엔드 오디오 모델 프로토타이핑 및 개선
- 실시간 통신 시스템에 모델 통합 및 최적화 (품질, 지연 시간, 확장성)
- 최신 음성 처리 기술 동향 파악 및 특허/지식 공유 기여
자격 요건
- 스트리밍, 악센트/목소리 변환, TTS, ASR 관련 분야 박사 학위 또는 그에 준하는 경험
- PyTorch 또는 TensorFlow 등 딥러닝 프레임워크 숙련도
- Python, C/C++ 프로그래밍 능력
- Transformer, RNN, Diffusion models, Conformer 등 시퀀스 모델링 아키텍처 이해
- 저지연 실시간 음성/오디오 모델 개발 및 배포 경험
- 모델 압축 및 가속화 기술(Quantization, Pruning, Distillation) 지식
- ICASSP, INTERSPEECH, NeurIPS, ICLR 등 주요 학회 논문 게재 경험
- 2년 이상의 관련 산업계 경력 우대
기술 스택
PyTorchTensorFlowPythonCC++TransformersRNNsDiffusion modelsConformersQuantizationPruningDistillation
zoom의 다른 공고
Executive Assistant
경영지원Director, Strategic Sourcing & Category Strategy: Enterprise Technology
경영지원DevOps Engineer
인프라·DevOpsChannel Account Manager - KSA
영업Data Engineer, People Analytics
데이터, 인프라·DevOpsResearch Scientist - AI Incubation
AI·머신러닝, 연구·R&DAI Engineer
개발, AI·머신러닝, 인프라·DevOpsWorkplace Operations Lead
경영지원, 현장운영