Community

오픈소스 텍스트 음성 변환 및 합성 모델 VALL-E X

마이크로 소프트의 VALL-E X을 오픈소스로 구현한 구현체입니다. 영어, 일본어, 중국어를 지원하며 결과물이 정말 놀랍습니다. 한국어가 없는 것은 조금 아쉽네요. 사용한 기술 중에 bark라는 텍스트 - 오디오 변환 모델이 있습니다. 해당 모델에서 한국어를 지원하고 있어서 조금만 수정하면 한국어도 지원 할 수 있지 않을까라는 생각이듭니다. 데모페이지에 다양한 자료 및 테스트 결과들이 있습니다. https://plachtaa.github.io/ https://github.com/Plachtaa/VALL-E-X

알림

알림이 없습니다