커리어리 친구들, 세번째 에피소드입니다. 지난 주 OpenAI가 GPT-Real Time 이라는 고급 음성 모델과 개선된 Real Time API를 출시했던 내용을 정리해 봤습니다.
참고로 GPT-Real Time은 오디오를 직접 이해하고 생성하는 통합 모델로, 기존 방식보다 속도, 뉘앙스 이해, 감정 및 다국어 표현력이 뛰어나며 이미지 입력과 함수 호출 기능이 강화되었습니다.
또한, 새로운 기능에는 감정 범위, 다국어 지원, 지시 따르기 등이 포함되었는 데 직접 한번 보시죠 ^^
https://youtu.be/LZ4aldYJkU8?si=jM506kps9oubXg_9
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2025년 8월 31일 오전 1:59