요즘 나오는 AI 비디오 편집 툴이나 플러그인들이, 음성인식과 OCR로 자막을 먼저 자동으로 만들고, 자막과 사람 얼굴 그리고 사운드 형태를 기준으로 컷편집을 해 주는 것이 대부분인 것을 보니..


5~6년 전에 완전히 동일한 컨셉으로 기술을 개발해 네이버 검색, 스포츠와 VLIVE 등에 반영했던 Video Understanding, AutoCut 등이 불현듯 생각나면서 기술뽕이..


그러고보니 그 때 이미 얼굴 이미지 생성으로 학습 데이터를 만들거나 메신저 스티커나 CF 영상 등에 사용하는 프로토타입도 만들어서 선보였었고, 텍스트+코드 페어를 생성해 학습 데이터를 만들어서 입코딩하는 데모도 만들었었는데..


그런걸 보면 내가 아주 뛰어난 기술자는 아니어도, 기술의 흐름을 보는 눈이나 제품 아이디어는 잘 내는 편인 것 같음. 문제라고 하면..사람들이 이해하기 어려운 시점에 너무 일찍 만든다는게 문제..(…)

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2023년 10월 24일 오전 4:47

댓글 0