얼마전 meta에서 V-JEPA(Video-Joint Embedding Predictive Architecture)를 공개했습니다.

V-JEPA는 인간처럼 효율적으로 배우는 머신을 만드는게 목표라고 하네요.


자기주도학습으로 세상이 작동하는 것을 학습했다고 하는데,

한 영상 내에서 물체를 인식하고, 물체의 동작이나 상호작용을 이해할 수 있는 모델이라고 합니다.

요새 핫한 생성형 모델은 아니라고 합니다.


영상에서 가려진 부분이 어떻게 되어있을지를 예측할 수 있는 모델인데,

샘플 영상을 보면, 종이를 넘기는 장면에 가려진 부분을 그럴싸하게 채워넣고 있습니다.


더 발전해서 자율 주행 등과 접목하면, 차 뒤편에서 갑자기 뛰어나오는 사람 등을 인식한다거나, 여러 방면으로 쓰일 수 있을 것 같습니다.


Video-JEPA 라고 했지만 이미지만 인식하는 단계라고 합니다. 향후에는 음성을 포함해서 예측할 수 있게 발전시킬 예정이라고 합니다.

V-JEPA: The next step toward advanced machine intelligence

AI at Meta

V-JEPA: The next step toward advanced machine intelligence

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 2월 20일 오후 5:31

댓글 0

    함께 읽은 게시물

    나머지 책들도 알려달라고 하셔서 적어봅니다.

    ... 더 보기
    profile picture

    골빈해커

    Chief Maker

    내가 꼽는 소프트웨어 개발자 필독서 Top 3 중 하나. AI가 구현(코딩)을 대신해주는 시대이기에 소프트웨어 개발자라면 더욱 필수적으로 읽어야 할 책이 아닐지. 하지만 10년 뒤에는 코딩이라는 행위가 정말로 로스트 테크놀로지 같은 느낌이 될 수도 있을 것 같아, 한 번 더 읽어보기로했다.


    오늘의 탐라는 git rebase로군요.


    작은 팀에서는 rebase없이 그냥 날것의 커밋을 공유하는게 좋다고 생각하고, 큰 팀에서는 로컬 커밋에서만 자잘한 커밋을 약간 정리하는 차원에서 rebase를 하는게 좋다고 생각합니다.

    조회 1,045


    알고리즘 왜 풀어야 함?

    ... 더 보기

    알고리즘은 왜 풀어야 하나요?

    velog.io

    알고리즘은 왜 풀어야 하나요?

    FSD와 Clean Architecture의 만남: Clean F.S.D

    FSD(Feature-Sliced Design)와 Clean Architecture.
    두 가지는 출발점이 달라 보이지만,

    ... 더 보기

    기술을 어떻게 학습하시나요?

    최근에 누군가 내게 "기술을 어떻게 학습하시나요?"라는 질문을 한 적이 있다. 머릿속에는 정말 다양한 생각들이 스쳤지만, 나는 그중에서도 가장 중요하다고 생각하는 한 가지를 답했다. 기술을 배우는 데 필요한 것은 딱 하나, 충분한 관심이라고 생각한다. 여기서 말하는 관심은 그저 흥미로 끝나는 것이 아니라, 끊임없이 관찰하고 확인하고 왜를 고민해보는 적극적인 호기심을 의미한다.

    ... 더 보기

    개발자를 선택한 이유

    저는 직업이 인생에서 가장 중요한 요소라고 생각합니다. 인생의 2/3 이상을 일에 투자해야 하기 때문입니다.

    ... 더 보기

    조회 72