arcee-ai/Llama-3.1-SuperNova-Lite · Hugging Face
huggingface.co
Llama 3.1 405B보다 높은 성능의 70B 모델 Acree Supernova
Llama-3.1-SuperNova-Lite는 Arcee.ai에서 개발한 80억 파라미터 모델로, Llama-3.1-8B-Instruct 아키텍처를 기반으로 합니다. 이 모델은 첫번째로, 더 큰 Llama-3.1-405B-Instruct 모델을 증류, 4,050억 파라미터 변형에서 추출한 오프라인 로짓을 활용합니다. 그리고 이어서, Spectrum과 자체 개발한 instruction tuning dataset framework인 Evolkit으로 Llama-3.1-70B를 Fine tuning 시킵니다. 마지막으로, 세번째 Llama 3.1 70B를 direct preference optimization 를 통해 instruction-tuning 시킵니다.
두번째 모델과 세번째 모델을 merge한 모델을 최종적으로 첫번째 모델과 Merge하여, SuperNova-70B의 제작이 완료됩니다. SuperNova는 Claude-3.5-Sonnet, GPT-4o 등의 상용모델과 Llama-3.1-405B보다 높은 IFeval score를 기록하였으며, BigBenchHard, Math-Hard, MMLU-Pro등의 난이도 높은 벤치마크에서 Llama-3.1-70B-instruct를 상회하는 결과를 보여주었습니다. SuperNova 70B 모델은 API를 통해 제공되며, 8B 모델은 웨이트를 배포하고 있습니다.
Acree Supernova : https://huggingface.co/arcee-ai/Llama-3.1-SuperNova-Lite
Acree Evolkit : https://github.com/arcee-ai/EvolKit
노래의 보컬과 반주를 포착하여 이해하고 편집하는 SongCreator
음악은 인간의 지능과 창의성을 구현하는 인류 문화의 필수적인 부분이며, 그 중 노래는 핵심적인 요소입니다. 이전 연구들이 노래 생성의 다양한 측면, 예를 들어 가창 음성, 보컬 작곡, 기악 편곡 등을 탐구해왔지만, 가사를 바탕으로 보컬과 반주를 모두 포함한 노래를 생성하는 것은 여전히 큰 도전 과제로 남아있으며, 이는 음악 생성 모델의 실제 응용을 저해하고 있습니다. 이러한 맥락에서, 홍콩의 대학교 연합 연구진이 이 과제를 해결하기 위해 설계된 노래 생성 시스템인 SongCreator를 발표하였습니다. 연구자들은 노래 생성을 위해 보컬과 반주의 정보를 포착하는 이중 시퀀스 언어 모델(DSLM)과 DSLM을 위한 추가적인 어텐션 마스크 사용으로 모델을 구성히였습니다. 이를 통해 SongCreator는 노래를 이해하고, 생성하고, 편집할 수 있어 다양한 노래 관련 생성 작업에 적합성을 입증하였습니다. 여러 실험을 통해 SongCreator는 8가지 형태의 노래 관련 생성 작업에 SOTA 혹은 SOTA에 버금가는 성능을 증명하였으며, 특히 가사-노래 변환과 가사-보컬 변환에서 이전 연구들을 큰 차이로 뛰어넘었습니다.
https://songcreator.github.io/
이론과 실무를 잇-다!
데이터로 비즈니스 가치를 만드는 데이터 사이언티스트 전문 과정 모집 중 : https://bit.ly/3YBFXNf
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 9월 11일 오전 7:30
외국어를 사용해서? 돈을 더 많이 벌어서? 새로운 기회가 많아서? 글로벌 경력을 쌓을 수 있어서?
... 더 보기