Jonas Kim

데이터 과학자, ML 엔지니어

아마존 세이지메이커와 생성 AI를 통한 가상 패션 스타일링

AWS ML 블로그에 올라온 글(https://aws.amazon.com/blogs/machine-learning/virtual-fashion-styling-with-generative-ai-using-amazon-sagemaker/) 재미있네요. ✔️ 전체적인 작업 흐름은 다음과 같습니다. ① 패션 아이템 이미지 셋으로 스테이블 디퓨전 인페인팅 모델을 미세 조정한다. ② 미세 조정한 모델을 배포한다. ③ CLIPSeg 모델에 변경할 대상인 패션 아이템 텍스트(예: 스커트)를 입력해서 시맨틱 세그멘테이션을 한다. ④ 결과로 나온 마스크 이미지와 텍스트 프롬프트(예: 여행용 롱 스커트를 입고 있는 슈퍼모델, 포토리얼리스틱)를 입력하여 원하는 스타일링 이미지를 생성한다. 결국 핵심 아이디어는 CLIPSeg 모델로 바꾸고 싶은 패션 아이템 마스크를 구하고 그걸 스테이블 디퓨전 인페인팅 모델에 텍스트 프롬프트과 함께 입력해서 원하는 패션 아이템으로 스타일링하는 거죠. ✔️ CLIPSeg(https://arxiv.org/abs/2112.10003)은 텍스트 또는 이미지 프롬프트 기반의 시맨틱 세그멘테이션 모델, 말 그대로 세그멘테이션을 위한 CLIP 모델입니다. 사전 훈련한 CLIPSeg 모델(https://github.com/timojl/clipseg)에 패션 아이템 텍스트로 마스크 이미지를 생성합니다. p3.2xlarge 인스턴스 정도가 필요합니다. ✔️ 패션 아이템 이미지와 텍스트 프롬프트 셋으로 스테이블 디퓨전 인페인팅 모델을 미세 조정합니다. 이미지 장수가 적은데 드림부스(https://github.com/XavierXiao/Dreambooth-Stable-Diffusion)의 클래스 별 사전 보존 손실을 사용하여 과적합 문제을 해결합니다. 768 x 768 해상도를 위해서는 22GB 이상 VRAM이 필요합니다. 단일 인스턴스로는 어렵고 허깅페이스 액셀러레이트 분산 구성으로 미세 조정을 실행해야 합니다. (이때, 슬라이스 버전의 어텐션을 추가 적용하여 메모리 절약이 가능합니다.) ✔️ 세이지메이커의 HuggingfaceModel 클래스를 사용하여 미세 조정한 모델을 배포합니다. g4dn.xlarge 인스턴스 정도가 필요합니다. 그다음은 가이던스 스케일 파라미터를 조정해 가면서 원하는 대로 실시간 이미지 생성을 하면 됩니다!

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 3월 12일 오전 2:31

저장 4 • 조회 2,246

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

하루 전

< 스포티파이와 멜론, 같은 음악인데 왜 경험은 다를까? >

1. 엔터테인먼트 프로덕트의 본질은 콘텐츠다. 사용자는 콘텐츠를 소비하며 감정을 느낀다. 재미, 감동, 공포, 희열. 인간의 다양한 감정이 콘텐츠를 통해 꺼내진다.

댓글 1 • 저장 4 • 조회 574

레드버스백맨

리서처 앤 라이터

2일 전

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

어

토스·당근·오늘의집, 찔끔 흑자라고 웃을 때 아닙니다 (파인드어스 이재용 회계사) | Walcoln SJ Rhee

www.linkedin.com

저장 3 • 조회 899

장혜림 (메이)

프리랜서 테크 비즈 라이터

18시간 전

AI 시대, 작아지는 팀 규모 : 채용은 어떻게 해야 할까?

과

제너럴리스트, 플레이어 코치…이제 작은 팀으로 큰 임팩트 낸다

조회 309

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

16시간 전

직장인으로서 10년 정도 일하게 되면 피할 수 없는 순간이 바로 조직에서 리더의 역할을 받게 되는 인사발령이다. 팀원이었을 때는 내게 주어진 업무를 내가 가진 능력과 주변 동료들의 도움으로 해결하고, 그에 합당한 평가와 보상을 기다리며, 나쁘지 않는 리워드와 내 위치에 안도하며 또 새해를 맞이하고 하루하루를 버텨나가는 과정에 큰 어려움이 없다.

•

저장 3 • 조회 272

한성규

'지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

하루 전

👋 LLM 활용에 도움이 되는 가이드 모음

✅️Prompting Guide 101 by Google : https://lnkd.in/d8UwPWeN

•

저장 7 • 조회 487

석민

커리어 코치

하루 전

이력서에 쓰는 경험

댓글 1 • 저장 4 • 조회 804

비슷한 게시물

변성윤 머신러닝 엔지니어, Engineering Manager

토스의 AI 그래픽 생성기, 토스트를 소개합니다

Jonas Kim 데이터 과학자, ML 엔지니어

‘모두를 위한 렌사’ 만들기

골빈해커 Chief Maker

ChatGPT와 Bing Chat의 이미지 생성 기능은 둘 다 DALL-E 3를 사용하고 있습니다. 그런데 둘 다 써보신 분들은 이미지 생성 품질이 다르다는 것을 쉽게 아실 수 있

원강민 Product Engineer

[요약] 메타 AI SAM 세그먼트 애니씽 모델 데모 및 설명 오픈 소스

해봄 한량

Midjourney V6: 중요해진 Prompt 구조, 섬세해진 표현

pliossun 디자이너

피그마의 Dev Mode 활용하기

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

김하림 우아한형제들 프론트엔드 개발자

타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

Arawn Park Senior Engineer & Engineering Lead

나는 시스템 빌더이다

석민 커리어 코치

이직의 조건

골빈해커 Chief Maker

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트

동크루트 AI 엔지니어, SW 엔지니어

샘 알트만: "지금 당신이 o3보다 더 똑똑하다고 생각하세요?"

장홍석 스페이스오디티 부대표/CPO

< '네이버 다녀요'라는 말에 아무도 무슨 일을 하는지는 묻지 않

장홍석 스페이스오디티 부대표/CPO

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와

송요창 배민 프론트엔드 프로그래머

ChatGPT 버전명 설명

레드버스백맨 리서처 앤 라이터

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것

아마존 세이지메이커와 생성 AI를 통한 가상 패션 스타일링

댓글 0

함께 읽은 게시물

< 스포티파이와 멜론, 같은 음악인데 왜 경험은 다를까? >

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

AI 시대, 작아지는 팀 규모 : 채용은 어떻게 해야 할까?

👋 LLM 활용에 도움이 되는 가이드 모음

이력서에 쓰는 경험

비슷한 게시물

주간 인기 TOP 10

추천 프로필