[1126]모두에게 전하는 모두연 AI뉴스!

Diptych Prompting 을 통한 개선된 제로샷 이미지 프롬프팅

Subject 중심 텍스트-이미지 생성은 새로운 대상의 시각적 특성과 텍스트 프롬프트의 의미를 정확하게 포착하는 것을 목표로 합니다. 기존 방법들은 대상 정렬을 위해 시간과 자원이 많이 소요되는 미세 조정에 의존했지만, 최근 제로샷 접근법은 정확성을 희생하곤 했습니다. 이를 개선하기 위해 서울대학교 연구진은 'Diptych Prompting'이라는 혁신적인 제로샷 접근법을 제안합니다. 이 방법은 참조 이미지를 왼쪽 패널에 배치하고, 오른쪽 패널에 텍스트 기반 인페인팅을 수행합니다. 참조 이미지의 배경을 제거하고 패널 간 주의 가중치를 조정하여 원치 않는 콘텐츠 유출을 방지하고 세밀한 디테일을 개선합니다. 실험 결과, 이 접근법은 기존 제로샷 이미지 프롬프팅 방법들보다 뛰어나며 사용자들이 선호하는 이미지를 생성합니다. 나아가 대상 중심 생성, 스타일화된 이미지 생성, 대상 중심 이미지 편집 등 다양한 이미지 생성 응용 분야에서 그 활용 가능성을 입증했습니다.

https://diptychprompting.github.io/

물리기반 텍스쳐 자동 생성 프레임워크 Material Anything

상하이랩 연구진이 3D 객체를 위한 물리 기반 텍스쳐를 자동으로 생성하는 통합 확산 프레임워크, Material Anything을 제안하였습니다. 복잡한 파이프라인이나 사례별 최적화에 의존하는 기존 방법들과 달리, Material Anything 은 다양한 조명 조건에 적응할 수 있는 엔드-투-엔드 솔루션을 제공합니다. 사전 훈련된 이미지 diffusion model 을 기반으로, 트리플-헤드 아키텍처와 렌더링 손실을 통해 재질의 안정성과 품질을 개선했습니다. 또한, 'Confidence Mask'를 도입하여 텍스처가 있거나 없는 객체를 다양한 조명 조건에서 효과적으로 처리할 수 있게 했습니다. 점진적인 텍스쳐 생성 전략과 UV-공간 텍스쳐 정제기를 사용해 일관되고 UV-준비 상태인 텍스쳐 출력을 보장합니다. 실험 결과, 다양한 객체 카테고리와 조명 조건에서 기존 방법들을 성능적으로 능가함을 증명했습니다.

https://xhuangcv.github.io/MaterialAnything/

[아이펠 12기] 2024 마지막 개강

AI 입문부터 활용까지! 코어과정 & 논문으로 완성하는 리서치과정:

https://bit.ly/40T8YFx

DiptychPrompting

diptychprompting.github.io

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 11월 26일 오전 9:17

비슷한 게시물

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

[1126]모두에게 전하는 모두연 AI뉴스!

댓글 0

비슷한 게시물

주간 인기 TOP 10

추천 프로필