소성은

Gen AI Field Solution Architect @ Google

ODISE라는 뛰어난 Panoptic Segmentation 모델 공개

Nvidia에서 Panoptic Segmentation task에 사용할 수 있는 ODISE 라는 모델을 공개했습니다. 흥미로운 점은 stable diffusion 같은 text-to-image diffusion model 을 활용해서 unseen class에 대해서도 할 수 있도록 했다는 점입니다. 그리고 이게 segmentation 전용 모델들의 점수를 뛰어넘어서 SOTA를 달성한 것도 인상적입니다. 해당 연구를 살펴보면 CLIP이나 Stable Diffusion이 얼마나 많은 기여를 했는지 다시한번 느낄 수가 있습니다. HF에 공개된 데모를 해 보니 틀리게 나오는 것들도 좀 있지만 성능이 꽤 인상적입니다. 아직 코드와 모델은 공개되진 않았지만, Nvidia의 경우 오픈소스로 공개를 잘 하는 편이기 때문에 곧 공개될 것으로 보입니다. 예전 StyleGAN 계열은 non-commercial license였기 때문에 그럴 가능성도 있습니다만 base model 들을 비슷하게 활용한 다른 완전한 오픈소스 모델도 많이 나올 것 같습니다. Foundation model 들이 정말 많은 부분에서 기여를 해 주는 것 같습니다. 앞으로는 기존에 거북이처럼 느린 속도로 개선되던 부분들이 크게 나아진 모델들이 쏟아져 나올 것 같습니다. 물론 아직까지 비싼 리소스의 필요성과 느린 속도는 해결해야 될 문제이지만, 앞으로 더 많은 분야에서 ML 기술이 기여를 할 수 있게 될 것 같습니다.

Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models

Jerryxu

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 3월 13일 오전 12:56

저장 3 • 조회 2,453

최광우
지수inc 유지관리팀 사원 • 2023년 03월 13일
좋아요 ♥️

함께 읽은 게시물

이건승

카카오스타일 | CRM 데이터 분석가 & Team Lead

2024년 01월 21일

데이터 분석에서 강조하는 <도메인 지식>의 중요성은 무엇일까?

데

데이터 분석에서 강조하는 «도메인 지식»의 중.. : 네이버블로그

blog.naver.com

저장 6 • 조회 605

골빈해커

Chief Maker

5일 전

나는 가끔 조합형 한글의 아름다움에 대해 생각한다.

그 아름다움은 단순히 예쁜 글꼴이나 정갈한 종이 위의 자소 배열에서 끝나지 않는다. 진짜 매력은, 정밀한 정보 구조와 이산 수학적 규칙성 속에 숨어 있다.

저장 5 • 조회 2,267

psmon

웹노리라이터

2일 전

서버엔지니어의 시대적 고민

서

저장 4 • 조회 1,178

석민

커리어 코치

4일 전

이력서에 쓰는 경험

댓글 1 • 저장 13 • 조회 1,162

비슷한 게시물

골빈해커 Chief Maker

OpenAI 에서 차세대 이미지 생성 모델인 Consistency 모델 코드를 공개. (논문은 오래전?에 공개함)

전동현 네이버 AI Research Engineer / Leader

Nvidia의 새로운 LLM Inference 라이브러리

해봄 한량

Stable Diffusion, SDXL 0.9 출시

손현우 Software Engineer

Ferret - 애플의 오픈소스 MLLM

소성은 Gen AI Field Solution Architect @ Google

Google에서 Gemma라는 LLM을 공개했습니다.

Hyj 프론트엔드 개발자

ChatGPT의 업데이트 예정인 기능, 메모리(memory) 기능

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

김하림 우아한형제들 프론트엔드 개발자

타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

Arawn Park Senior Engineer & Engineering Lead

나는 시스템 빌더이다

석민 커리어 코치

이직의 조건

골빈해커 Chief Maker

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트

동크루트 AI 엔지니어, SW 엔지니어

샘 알트만: "지금 당신이 o3보다 더 똑똑하다고 생각하세요?"

장홍석 스페이스오디티 부대표/CPO

< '네이버 다녀요'라는 말에 아무도 무슨 일을 하는지는 묻지 않

장홍석 스페이스오디티 부대표/CPO

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와

송요창 배민 프론트엔드 프로그래머

ChatGPT 버전명 설명

레드버스백맨 리서처 앤 라이터

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것

ODISE라는 뛰어난 Panoptic Segmentation 모델 공개

댓글 1

함께 읽은 게시물

데이터 분석에서 강조하는 <도메인 지식>의 중요성은 무엇일까?

서버엔지니어의 시대적 고민

이력서에 쓰는 경험

비슷한 게시물

주간 인기 TOP 10

추천 프로필