Now you can transcribe speech with Google Translate
총 사용자 5억명 이상에, 매일 천억회 이상의 번역을 하는 구글 번역 서비스. 여기에 실시간 통역 서비스가 업데이트 됐어요. 실시간으로 다른 나라 말을 통역해서 핸드폰에 텍스트로 띄워줘요. 구글 번역 앱에서 업데이트 됩니다. 영화 자막처럼 실시간으로 외국 ‘말’을 ‘읽을’ 수 있게 됐다는 것이죠. 구글 번역 앱에서 음성 인식 설정하는 것과 다른 점은 길이입니다. 학교 수업, 컨퍼런스, 강연 영상 등 긴 이야기를 통째로 통역해준다는 거예요. 입이 떡 벌어지는 한편 ‘이게 어떻게?!’에 관심이 갑니다. 구글 번역이 작동하는 원리에는 특별한 아키텍처와 다중 언어 훈련법이 있어요. '제로샷 번역'인데요. 예를 들어 영어, 한국어, 일본어가 있다고 치면 영어 데이터는 충분히 수집, 분석했는데 한국어, 일본어 데이터는 상대적으로 부족할 수 있죠. 그래서 하나의 언어(영어)를 하나의 모델로 훈련시켜서 다양한 언어(한국어, 일본어)로 번역할 수 있게 만드는 것이죠. 영어-한국어 훈련을 하고, 영어-일본어 훈련을 했으면 한국어-일본어 조합 번역이 가능하게 만들고 있다는 이야깁니다. 수억이 넘는 사람들이 사용하는 서비스기 때문에 효율적인 번역을 하기 위해 데이터 등 자원을 최대한 적게 사용해서 번역 가능한 언어의 수를 빠르게 늘려야 합니다. 기술도 그에 맞춰 구현하는 것이고요. 구글의 클라우드 서비스, 이 클라우드 서버를 동작시킬 때 인공지능(AI) 용도로만 사용하는 프로세서(TPU), 픽셀폰의 실시간 통역 서비스 기술을 합쳤다고 하고요. 말로는 쉽게 풀어지지만 정말 어마어마한 일입니다. 개발자 뿐만 아니라 언어학자, 사회학자 등등이 붙어서 해야하는 일이에요. 구글에는 구글 브레인이라는 연구 팀이 따로 있네요. *참고: https://ai.googleblog.com/2016/11/zero-shot-translation-with-googles.html 다만 기술과 숫자에만 함몰돼 '빠르고 정확한' 번역기를 개발하는 데에만 몰두하지 않았으면 합니다. 언어를 사용하는 것은 그 언어만 익히는 것이 아니라 사용하는 지역, 문화, 행동을 같이 배우는 과정이니까요. 사회적인 가치를 고려하고 편견을 최대한 배제하는 방향으로 번역기를 개발해주었으면 하는 바람입니다.
2020년 3월 18일 오전 1:56