Community

최근에는 구글의 [MusicLM](https://google-research.github.io/seanet/musiclm/examples/) 이나 메타의 [MusicGen](https://huggi

최근에는 구글의 [MusicLM](https://google-research.github.io/seanet/musiclm/examples/) 이나 메타의 [MusicGen](https://huggingface.co/spaces/facebook/MusicGen) 등의 음악 생성 AI 모델들의 퀄리티도 한층 좋아진 것 같은데요. 오디오 관련 멀티모달도 곧 많은 활용처가 생기지 않을까 싶네요. 저희 팀에서 인턴으로 함께 연구했던 분이 오디오와 텍스트를 활용해서 이미지를 생성하는 모델을 CVPR Workshop 논문 발표한 것도 있어서 공유합니다^^ 아래의 프로젝트 페이지에서 간단한 비디오 샘플들도 확인해볼 수 있습니다. Project page: https://lifrary.github.io/AADiff/ Paper: https://arxiv.org/pdf/2305.04001.pdf

알림

알림이 없습니다