[Video] Jin Joong Kim on LinkedIn: GPT-4o 데모처럼 음성 대화시 말을 끊으면서 대화하는 것을 구현해보았다. OpenAI에서 API로 제공하는 Whisper...
www.linkedin.com
GPT-4o 데모처럼 음성 대화시 말을 끊으면서 대화하는 것을 구현해보았다.
OpenAI에서 API로 제공하는 Whisper, GPT-3.5, TTS를 사용했는데, 스트리밍을 지원하지 않으니 아무리 최적화를 해도 반응이 자연스럽지 않다. 🫠
보편적인 API 만으로 어느정도 수준까지 가능할까 싶어서 해 봤는데, 자연스런 대화를 만들려면 성능이 낮아도 Latency가 낮고 스트리밍을 지원하는 다른 API를 써야 할 듯.
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 6월 2일 오후 4:49