🩵 모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다.
그럼, 오늘의 AI 뉴스 시작해 볼게요!
1️⃣ MagiCapture: 고해상도 인물 이미지 생성을 위한 개인화 방법론
(https://huggingface.co/papers/2309.06895)
대규모 텍스트-이미지 모델, 특히 스테이블 디퓨전,은 사실적인 인물 이미지 생성이 가능하지만, 사실성에는 한계가 있어 상업적 수준에 도달하지 못하고 있습니다. 인물 이미지의 부자연스러운 부분은 인간이 쉽게 감지할 수 있습니다. MagiCapture는 이 문제를 해결하기 위한 개인화 방법으로, 몇 장의 참조 이미지만으로 고해상도 인물 이미지를 생성합니다. 주어진 무작위 셀카를 기반으로 미세 조정된 모델로 여권이나 프로필 사진과 같은 스타일의 이미지를 생성할 수 있습니다. 하지만, 합성 과정에서의 품질 저하와 소스 피사체의 신원 변경 문제가 있습니다. MagiCapture는 이를 해결하기 위해 주의 재집중 손실과 보조 전처리를 도입하고, 감독이 약한 학습 환경에서 강력한 학습을 지원합니다. 후처리 단계를 통해 더욱 사실적인 결과물을 생성하며, 다른 객체에도 적용 가능하다는 장점이 있습니다.
2️⃣ LLVM 어셈블리 최적화를 위한 대규모 언어 모델 활용 연구
(https://huggingface.co/papers/2309.07062)
대규모 언어 모델을 사용하여 코드 최적화 방법을 연구합니다. LLVM 어셈블리를 최적화하기 위해 7B 매개변수 트랜스포머 모델이 개발되었으며, 이 모델은 최적화되지 않은 어셈블리를 입력으로 사용하여 최적의 컴파일러 옵션을 제시합니다. 학습 중에 모델은 최적화 전후의 명령어 수와 최적화된 코드를 예측하게 되어, 이 과정이 모델의 성능과 이해도를 향상시킵니다. 이 방법은 컴파일러와 비교하여 명령어 수를 3.0% 개선하였고, 코드 추론 능력도 뛰어나 91%의 시간 동안 컴파일 가능한 코드를 생성하며 70%의 시간 동안 컴파일러 출력을 완벽하게 모방합니다.
3️⃣ 딥러닝 기반 NeRF을 활용한 축구 경기 합성 연구
(https://huggingface.co/papers/2309.06802)
스포츠 방송, 특히 축구 경기의 신규 뷰 합성은 방송 업계에서 큰 관심을 받지만, 높은 품질의 합성 리플레이를 생성하는 산업용 솔루션은 많지 않습니다. 대부분의 고급 시스템은 작동 방식을 공개하지 않으며, 여러 대의 정적 카메라를 활용하는 방식은 많은 도전 과제를 안고 있습니다. 하지만 최근 딥러닝 기반의 NeRF가 등장하면서, 사실적인 시각 합성 애플리케이션이 개발되었습니다. 이 연구에서는 NeRF을 사용하여 축구 장면의 합성에 대한 가능성을 탐구합니다. 결과는 완벽하지 않지만, 비용 효율적인 자동 솔루션의 가능성을 보여줍니다. 연구자들은 이 분야의 추가 연구를 위해 데이터 세트와 코드를 공개하였습니다.
—
📍AI학교 아이펠 7기 무료 입학하기! → https://bit.ly/3YDkLV4