📝 음성 AI 시대가 “다시” 열리다

어제 OpenAI의 Paris 밋업에서 GPT-4o 시연을 추가로 진행 했습니다.


GPT-4o를 열고 영어로 길게 말 한뒤 불어로 번역해달라고 하는 간단한(?) 시연도 했고요. Sora로 만든 영상 클립에 대해 나레이션을 만들어달라고 하니, 스크립트를 작성하고 바로 해당 영상에 나레이션을 삽입하는 등의 재미난 시연도 했습니다.


전부 라이브로 시연을 했는데, 지난 주 발표 때 만큼이나 매끄러웠습니다. 정말 대단히 자연스럽더군요.


더불어 오늘은 편의 기능을 많이 갖춰 폭발적으로 인기를 끌고 있는 브라우저인 Arc에서 음성 대화 기능을 발표했습니다.


마치 Arc라는 에이전트에게 전화를 해서 물어보는 것과 같은 UX를 보여주는데요. 아직 초반이라 아쉬운 면이 분명 있지만, 꽤 유용하고 유망해 보입니다. 그 외에도 많은 서비스들이 음성 인터페이스를 속속 내 놓고 있고요.


저도 음성 인터페이스에 매우 긍정적인 입장을 가진 사람인데요. 앞으로 컴퓨터를 사용하는 UX의 많은 부분이 바뀌지 않을까 싶습니다. 수년전 AI 스피커가 우후죽순 나왔다가 모두 실패로 끝났지만, 그 때는 LLM이 없었으니까요. 😎🍿🥤

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 5월 24일 오전 4:37

댓글 0