- Stable Diffusion은 아마도 가장 보편적으로 사용되는 이미지 생성 모델
- 오픈소스이다 보니 각종 커뮤니티, 그룹에서 파인튜닝 해서도 많이쓰고 DreamBooth 등과 붙여 쓰기 편하고 Controlnet 같은 모듈이 적극적으로 나와 주기도 했고...
- 또한 Stable Diffusion 기반으로 모델을 더 키워서 창업하는 사례도 다수 있음(국내에선 라스코, 플라스크 같은)
- 물론, 오픈소스이다 보니 뒤틀린(?), 날 것의 욕망을 투영하는 사례도 있지만 이 또한 흐름이라고 개인적으로 생각
- Stability AI가 Stable Diffusion 텍스트-이미지 모델의 새로운 버젼 SDXL 0.9을 발표
- SDXL 0.9는 이전 모델보다 대량의 향상된 이미지와 구성 세부 사항을 생성
- 모델은 현재 ClipDrop을 통해 액세스할 수 있으며 API는 곧 출시 예정
- SDXL 0.9는 생성적 AI 이미지의 창조적 사용 사례를 크게 발전시킴
- SDXL 0.9는 Clipdrop, Stability AI API 및 DreamStudio 고객을 위해 이용 가능하며, SDXL 1.0의 전체 오픈 릴리스는 7월 중순 예정
- SDXL은 영화, 텔레비전, 음악, 교육 비디오에 대한 초현실적인 작품 생성 능력을 제공하며 디자인 및 산업 분야에 대한 진보를 이끌어냄
- SDXL 시리즈는 기본 텍스트 프롬프팅을 넘어 이미지 간 프롬프팅, 인페인팅, 아웃페인팅과 같은 다양한 기능을 제공
- SDXL 0.9의 주요 향상 요인은 파라미터 수의 상당한 증가이며, 3.5B 파라미터 기본 모델과 6.6B 파라미터 모델 앙상블 파이프라인을 보유
- SDXL의 베타 런칭 이후 Discord 커뮤니티에서 약 7,000명의 사용자가 700,000개 이상의 이미지를 생성하고, 하루 평균 20,000개 이상의 이미지를 생성
- SDXL 0.9는 1024x1024의 더 깊고 고해상도 이미지를 생성하기 위해 OpenCLIP ViT-G/14를 사용하는 두 개의 CLIP 모델에서 실행됨
- SDXL 0.9는 GPU가 있는 환경에서만 실행 가능하며, Windows 10 또는 11 또는 Linux 운영 체제, 16GB RAM, Nvidia GeForce RTX 20 그래픽 카드(8GB VRAM 이상) 또는 호환되는 AMD 카드(16GB VRAM)를 필요
- SDXL 0.9는 연구 목적으로 제공되며, 일반적인 공개 릴리스 이전에 피드백을 수집하고 모델을 완전히 정제하기 위한 제한된 기간 동안만 사용 가능