얼마전 meta에서 V-JEPA(Video-Joint Embedding Predictive Architecture)를 공개했습니다.

V-JEPA는 인간처럼 효율적으로 배우는 머신을 만드는게 목표라고 하네요.


자기주도학습으로 세상이 작동하는 것을 학습했다고 하는데,

한 영상 내에서 물체를 인식하고, 물체의 동작이나 상호작용을 이해할 수 있는 모델이라고 합니다.

요새 핫한 생성형 모델은 아니라고 합니다.


영상에서 가려진 부분이 어떻게 되어있을지를 예측할 수 있는 모델인데,

샘플 영상을 보면, 종이를 넘기는 장면에 가려진 부분을 그럴싸하게 채워넣고 있습니다.


더 발전해서 자율 주행 등과 접목하면, 차 뒤편에서 갑자기 뛰어나오는 사람 등을 인식한다거나, 여러 방면으로 쓰일 수 있을 것 같습니다.


Video-JEPA 라고 했지만 이미지만 인식하는 단계라고 합니다. 향후에는 음성을 포함해서 예측할 수 있게 발전시킬 예정이라고 합니다.

V-JEPA: The next step toward advanced machine intelligence

AI at Meta

V-JEPA: The next step toward advanced machine intelligence

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 2월 20일 오후 5:31

댓글 0

    함께 읽은 게시물

    서버엔지니어의 시대적 고민

    ... 더 보기

    투표 완료!



    개발자는 개발만 잘하면 될까

    최근에 친구가 추천해준 데일 카네기의 인간관계론을 읽던 중 고액 연봉을 받는 엔지니어들의 특징에 대한 흥미로운 내용이 있었다.

    ... 더 보기

     • 

    저장 14 • 조회 2,664


    ‘똑부(똑똑하고 부지런하기)보다 똑게(똑똑하지만 게으른) 리더가 되라.’ 리더십 코칭에서 빠지지 않는 훈수다. 현장 리더들의 말을 들어보면 실행이 쉽지 않다.

    ... 더 보기

    [김성회의 고사성어 리더십] `똑게 리더십` 3가지 법칙 - 매일경제

    매일경제

    [김성회의 고사성어 리더십] `똑게 리더십` 3가지 법칙 - 매일경제

     • 

    저장 4 • 조회 749


    어제 AI 시대의 개발자 토론회에서 내가 대 AI 시대에는 버전관리 시스템이 필요없을 수도 있다고 생각해야한다는 말을 했는데, 그정도로 파격적인 생각을 해야한다는 이야기긴했지만, 진짜 그럴까?를 다시 한 번 생각해봤다.


    우선 버전관리 시스템의 목적은 크게 다음 세 가지다.


    ... 더 보기

    조회 1,744