Kimjeongeun

모두의연구소 아이펠캠퍼스 퍼실리테이터

[0730]모두에게 전하는 모두연 AI뉴스!

Meta, Segment Anything 2 발표

Meta가 SIGGRAPH에서 Segment Anything 2를 발표했습니다! SAM 2는 이미지와 비디오에서 실시간, 프롬프트 기반 객체 분할을 위한 통합 모델입니다. SAM 2는 모든 비디오나 이미지에서 어떤 객체든 분할할 수 있는 뛰어난 제로샷 일반화 성능을 가졌습니다. 이미지 분할 정확도를 검증하는 20여개의 벤치마크에서 이전 모델인 SAM의 능력을 뛰어넘고, 더 나은 비디오 분할 성능을 달성하면서도 상호작용 시간을 3분의 1로 줄였습니다. 추론 속도도 빨라져, 기존의 6FPS보다 6배 빠른 44FPS를 기록합니다. SAM 2는 개발자들이 다양한 실제 사용 사례에 바로 적용될 수 있도록 Apache 2.0 라이선스 하에 공개되었습니다 Meta는 또한 SA-V 데이터셋도 공개했습니다. 이는 기존의 가장 큰 비디오 분할 데이터셋보다 4.5배 더 크고 약 53배 더 많은 주석을 포함하여 컴퓨터 비전 분야의 새로운 연구를 가능하게 합니다

https://ai.meta.com/blog/segment-anything-2/

여러 Foundation model에서 시각 정보를 배우는 Robot policy, Theia

시각적 입력을 행동으로 매핑하는 Vision based robot policy 학습은 분류나 분할과 같은 단일 작업을 넘어서 다양한 시각적 작업에 대한 총체적인 이해를 필요로 합니다. 이에 착안하여, The AI의 연구진은 다양한 시각 작업에 대해 훈련된, CLIP, SAM, DINOv2 등의 여러 기성 비전 기초 모델들의 지식을 증류하는 로봇 학습용 비전 기초 모델인 Theia를 소개합니다. Theia의 풍부한 시각적 표현은 다양한 시각적 지식을 인코딩하여 하위 로봇 학습을 향상시킵니다. 광범위한 실험을 통해 Theia가 더 적은 훈련 데이터와 더 작은 모델 크기로 교사 모델들과 기존 로봇 학습 모델들을 능가함을 보여줍니다. 또한, 우리는 사전 훈련된 시각적 표현의 품질을 정량화하고, 특징 norm 분포의 엔트로피가 높을수록 로봇 학습 성능이 향상된다는 가설을 제시합니다.

https://github.com/bdaiinstitute/theia

[마감임박!] AI 개발자 과정의 압도적인 수준 차이! 입문자에서 전공자까지! 아이펠 9기 : https://bit.ly/4ePP8iK

Introducing SAM 2: The next generation of Meta Segment Anything Model for videos and images

AI at Meta

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 7월 30일 오전 6:50

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

6일 전

< 스타벅스 컵홀더의 손글씨가 말했다: 결국은 사람이다 >

댓글 1 • 저장 4 • 조회 707

𝙍𝙞𝙘𝙝𝙖𝙧𝙙

처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

5일 전

노션 템플릿들을 만들면서 적는 회고

노

저장 2 • 조회 1,758

석민

커리어 코치

7일 전

이력서에 쓰는 경험

댓글 1 • 저장 17 • 조회 1,435

비슷한 게시물

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[1104]모두에게 전하는 모두연 AI뉴스!

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0808]모두에게 전하는 모두연 AI뉴스!

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0723]모두에게 전하는 모두연 AI뉴스!

이원형 라인플러스 소프트웨어 엔지니어

Meta에서 크기 대비 엄청난 성능의 Llama 3를 발표한지 얼마 안됐는데,

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0805]모두에게 전하는 모두연 AI뉴스!

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

datarichard 블로그 페이지를 만들었습니다.

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

[0730]모두에게 전하는 모두연 AI뉴스!

댓글 0

함께 읽은 게시물

< 스타벅스 컵홀더의 손글씨가 말했다: 결국은 사람이다 >

노션 템플릿들을 만들면서 적는 회고

이력서에 쓰는 경험

비슷한 게시물

주간 인기 TOP 10

추천 프로필