6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스 회고록
taetaetae.github.io
여느때와 같이 유튜브의 바다에서 놀다가 보니 최근 발표된 GPT-4o 에 대한 영상들이 속속히 올라오는 것을 보게 되었습니다.
그런데 생각보다 GPT-4에서도 사용할 수 있던 음성 대화 기능을 GPT-4o 모델이 나오면서 생겼다고 오해하는 유튜버들이 좀 많더라구요.
더러는 그 기능을 사용하면서 "이것이 GPT-4o의 음성 대화 기능입니다." 라고 말하는 유튜버도 있더군요.
제 지인들도 이제 막 ChatGPT(GPT-4때 이미 있었던 기능)를 사용하면서 엄청 신기해 하는데... 정리를 한번 하고 갈 필요성이 있겠다 싶었습니다.
지금 (5월 17일 기준) 앱스토어/플레이스토어 에서 ChatGPT를 설치하여 사용하는 음성 대화 기능은 GPT-4 부터 있던 기능입니다.
GPT-4o 에서만 사용할 수 있는 음성 대화 기능이 나중에 업데이트 될 겁니다.
발표 영상을 보시면 UI가 좀 다를거예요.
GPT-4o 모델은 지금도 모델 목록에 추가되어서 선택도 할 수 있고 대화도 할 수 있습니다.
그런데, 어디까지나 기능 업데이트 전까지는 "텍스트 채팅"만 할 수 있는거죠.
현재 음성 대화도 결국엔 음성을 텍스트로 변환해서 대화하는겁니다.
GPT-4o가 화제가 된 것은 "멀티 모달" 이라고 불리는 텍스트를 포함한 음성, 영상도 인식할 수 있는 모델이 되어서입니다. (이미지는 GPT-4에서도 됐었으니 제외합니다.)
이것이 가능해지면서 GPT-4o는 더이상 음성 -> 텍스트 -> 모델 -> 텍스트 -> 음성 이 아니라 음성 -> 모델 -> 음성 의 프로세스로 음성 대화의 속도가 엄청 향상되고 자연스러워진거죠.
따라서 진짜는 아직이다.. 라는거예요..ㅎ
OpenAI 공식 커뮤니티에서는 새로운 음성 대화 기능의 출시에 대해서 in the coming weeks (몇주 내에) 라고 공지했어요.
사람들이 2주 후라고 말하긴 하는데 출처가 어디인지는 찾기가 어렵네요.
예전부터 OpenAI는 웹 브라우징, 코드 인터프리터 같은 기능들도 Plus를 구독한 사용자들에 한해서 점진적으로 풀어줘서, 남은 사용하는데 나는 사용 못하는 불합리한? 상황이 종종 있었습니다.
이번에도 상황은 비슷한 것 같구요.
그저 저는 OpenAI의 선택을 받기를 기다리고 있습니다..ㅋㅋ
지금까지 알아본 바로는 MacOS 데스크탑 앱의 경우 OpenAI의 선택...?을 받으면 웹 브라우저의 ChatGPT에서 준비가 되었다고 다운받으라는 알림이 떠서 받는다고 합니다.
근데 그마저도 그안에서 GPT-4 버전 음성 대화 기능만 지원한대요.
모바일 앱은... 깜깜 무소식.
이상... 너무 신기능을 써보고 싶어서 밤새면서 인터넷을 뒤져보았던 사이버 망령이었습니다..ㅎ
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 5월 16일 오후 5:37
안
... 더 보기1. 유명한 경제학자 케인스는 단기 투자 전략을 미인선발대회에 비유했다.
성장이 어려운 환경에서의 개발자 생활
저런 개발자 생활도 한적이 있어서 다양한 생각이 든다.
2005년 7월에 일을 시작했으니, 올해로 개발자 생활이 햇수로 20년째다. 중간에 공백이 조금씩 있었으니 꽉 채운 스무 해는 아니지만, 숫자가 주는 무게는 여전하다. 20년이라는 시간이 흘렀다는 사실이 새삼 신기하게 느껴진다.