[0220]모두에게 전하는 모두연 AI뉴스!

  • Zonos-v0.1: 고품질 오픈소스 TTS 모델 공개!

Zonos-v0.1은 20만 시간 이상의 다국어 음성 데이터로 훈련된 오픈소스 TTS 모델입니다. 텍스트 입력과 스피커 임베딩 또는 오디오 프리픽스를 사용해 자연스러운 음성을 생성하며, 몇 초 분량의 참조 음성으로 음성 복제도 가능합니다. 사용자는 발화 속도, 음높이, 감정 등을 조절할 수 있으며, 출력 음성은 44kHz 샘플링 레이트를 가집니다.
모델은 eSpeak 기반의 음소화 과정을 거치며, 1.6B 트랜스포머 및 SSM을 백본으로하는 하이브리드 구조를 사용합니다. Apache 2.0 라이선스로 공개되었으며, Huggingface에서 다운로드 가능하고 API 기반 서비스도 제공됩니다. 상용 TTS와 비교해도 높은 품질을 자랑하며, 무료 및 유료 구독 옵션을 지원합니다.


https://github.com/Zyphra/Zonos


  • 구글 위스크(Whisk): 이미지로 창작하는 새로운 AI 도구!

구글 랩스가 새로운 생성형 AI 도구 위스크(Whisk)를 한국에서 선보였습니다. 위스크는 기존 텍스트 기반 프롬프트 없이도 이미지만으로 창의적인 결과물을 생성할 수 있는 도구입니다. 사용자가 원하는 피사체, 장면, 스타일의 이미지를 업로드하면, 이를 분석해 새로운 이미지를 만들어주는 방식이죠.
이 과정에서 구글의 최신 AI 모델인 '제미나이(Gemini)'와 '이마젠 3(Imagen 3)'가 활용되어, 입력 이미지의 본질을 반영한 결과물을 생성합니다. 빠르게 다양한 시각적 아이디어를 탐색할 수 있도록 설계된 만큼, 창작 작업에 유용할 것으로 기대됩니다. 위스크는 현재 구글 랩스에서 체험할 수 있습니다.


https://blog.google/intl/ko-kr/company-news/technology/whisk-kr/


2017년부터 가치를 이어온 AI 명문
아이펠리서치 온라인13기 3월 개강 모집중 : https://bit.ly/4jzwrSS


데이터와 AI로 미래를 예측하는 데이터 사이언티스트 4기 모집 : https://bit.ly/3WJ4C0A

GitHub - Zyphra/Zonos: Zonos-v0.1 is a leading open-weight text-to-speech model trained on more than 200k hours of varied multilingual speech, delivering expressiveness and quality on par with—or even surpassing—top TTS providers.

GitHub

GitHub - Zyphra/Zonos: Zonos-v0.1 is a leading open-weight text-to-speech model trained on more than 200k hours of varied multilingual speech, delivering expressiveness and quality on par with—or even surpassing—top TTS providers.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 2월 20일 오전 7:17

댓글 0

    함께 읽은 게시물

    ✍️ 오늘은 PM이 읽어볼만한 책을 한 권 소개해드릴까 해요. 스스로의 동기부여가 어려운 분들이나, 동료를 설득해야되는 PM이나, 조직에 자발적 활력을 만들어내고 싶은 조직장 모두가 읽어볼만한 책입니다. — 📖 <스타트 위드 와이: 나는 왜 이 일을 하는가> 🔖 이성적 범주에 속하는 WHAT은 WHY에서 느껴지는 감정을 겉으로 보여주는 근거 역할을 한다. 어떤 직감으로 결정을 내렸는지 말로 표현할 수 있고 자신의 WHY를 명확히 설명할 수 있으면 주변 사람들에게 결정을 내린 이유를 분명히 이해시킬 수 있다. 이 결정이 객관적인 사실이나 수치와 일관성을 이룬다면 근거은 더욱 타당해진다. 이것이 바로 균형이다. (129p) — PM으로 일하면서 가장 어려운 일이 무엇이냐고 물어보면, 대부분 why를 조직장이나 동료들에게 설득하는 과정을 원탑으로 꼽을 겁니다. 문제를 정확히 정의하고, 논리를 만드는 것도 어렵고, 그것을 말이나 글로 표현해 내는 것도 어렵죠. 그래서 프로젝트 문서에 정량적인 데이터 분석을 수반하고, 숫자를 통해 프로젝트의 공감대를 형성하려고 시도할 때가 생깁니다. 하지만 Why에 대해 본인이 충... 더 보기


    어려운 문제를 대하는 태도

    

    ... 더 보기

    예제로 뿌수는 코틀린 Kotlin 프로그래밍 76제

    안드로이드 네이티브 앱 개발의 표준 언어이자, 최근 백엔드 개발에도 공격적으로 활용되고 있는 코틀린 프로그래밍 언어를 다양한 예제를 통해 배울 수 있는 온라인 학습 사이트를 공개합니다. 코틀린 공식 홈페이지에 있는 Kotlin By Example이라는 자료는 편역해서 구성했어요. 저는 NHN에 근무할 때 코틀린을 백엔드 API서버 개발에 활용한 경험이 있는데, 자바로 개발할 때보다 훨씬 편하고 즐거웠던 게 기억에 남았습니다. 코틀린을 배우시려거나, 이미 쓰고 있는데 궁금한 점이 많으셨던 분들에게 유용한... 더 보기

    예제로 격파하는 코틀린

    Hatemogi

    예제로 격파하는 코틀린

     • 

    저장 42 • 조회 2,400


    Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자로" 강의를

    ... 더 보기

    Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자"로

    www.productengineer.info

    Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자"로

     • 

    저장 8 • 조회 733


    결과보다 과정을

    

    ... 더 보기

     • 

    댓글 1 • 저장 4 • 조회 579