[0911]모두에게 전하는 모두연 AI뉴스!

  • Llama 3.1 405B보다 높은 성능의 70B 모델 Acree Supernova

Llama-3.1-SuperNova-Lite는 Arcee.ai에서 개발한 80억 파라미터 모델로, Llama-3.1-8B-Instruct 아키텍처를 기반으로 합니다. 이 모델은 첫번째로, 더 큰 Llama-3.1-405B-Instruct 모델을 증류, 4,050억 파라미터 변형에서 추출한 오프라인 로짓을 활용합니다. 그리고 이어서, Spectrum과 자체 개발한 instruction tuning dataset framework인 Evolkit으로 Llama-3.1-70B를 Fine tuning 시킵니다. 마지막으로, 세번째 Llama 3.1 70B를 direct preference optimization 를 통해 instruction-tuning 시킵니다.
두번째 모델과 세번째 모델을 merge한 모델을 최종적으로 첫번째 모델과 Merge하여, SuperNova-70B의 제작이 완료됩니다. SuperNova는 Claude-3.5-Sonnet, GPT-4o 등의 상용모델과  Llama-3.1-405B보다 높은 IFeval score를 기록하였으며, BigBenchHard, Math-Hard, MMLU-Pro등의 난이도 높은 벤치마크에서 Llama-3.1-70B-instruct를 상회하는 결과를 보여주었습니다. SuperNova 70B 모델은 API를 통해 제공되며, 8B 모델은 웨이트를 배포하고 있습니다.


Acree Supernova : https://huggingface.co/arcee-ai/Llama-3.1-SuperNova-Lite
Acree Evolkit : https://github.com/arcee-ai/EvolKit


  • 노래의 보컬과 반주를 포착하여 이해하고 편집하는 SongCreator

음악은 인간의 지능과 창의성을 구현하는 인류 문화의 필수적인 부분이며, 그 중 노래는 핵심적인 요소입니다. 이전 연구들이 노래 생성의 다양한 측면, 예를 들어 가창 음성, 보컬 작곡, 기악 편곡 등을 탐구해왔지만, 가사를 바탕으로 보컬과 반주를 모두 포함한 노래를 생성하는 것은 여전히 큰 도전 과제로 남아있으며, 이는 음악 생성 모델의 실제 응용을 저해하고 있습니다. 이러한 맥락에서, 홍콩의 대학교 연합 연구진이 이 과제를 해결하기 위해 설계된 노래 생성 시스템인 SongCreator를 발표하였습니다. 연구자들은 노래 생성을 위해 보컬과 반주의 정보를 포착하는 이중 시퀀스 언어 모델(DSLM)과 DSLM을 위한 추가적인 어텐션 마스크 사용으로 모델을 구성히였습니다. 이를 통해 SongCreator는 노래를 이해하고, 생성하고, 편집할 수 있어 다양한 노래 관련 생성 작업에 적합성을 입증하였습니다. 여러 실험을 통해 SongCreator는 8가지 형태의 노래 관련 생성 작업에 SOTA 혹은 SOTA에 버금가는 성능을 증명하였으며, 특히 가사-노래 변환과 가사-보컬 변환에서 이전 연구들을 큰 차이로 뛰어넘었습니다.


https://songcreator.github.io/


이론과 실무를 잇-다!

데이터로 비즈니스 가치를 만드는 데이터 사이언티스트 전문 과정 모집 중 : https://bit.ly/3YBFXNf

arcee-ai/Llama-3.1-SuperNova-Lite · Hugging Face

huggingface.co

arcee-ai/Llama-3.1-SuperNova-Lite · Hugging Face

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 9월 11일 오전 7:30

댓글 0

    함께 읽은 게시물

    데이터 드리븐 리포트 (1)

    책 [데이터 드리븐 리포트]를 읽고 757

    ... 더 보기

    🌎 해외에서 일하면 뭐가 좋을까요❓

    외국어를 사용해서? 돈을 더 많이 벌어서? 새로운 기회가 많아서? 글로벌 경력을 쌓을 수 있어서?

    ... 더 보기

    기본적으로 알아야 할 머신러닝 알고리즘 10

    머신러닝을 공부하면서 늘 헤깔리는 것중에 하나가 알고리즘 부문인 거 같습니다. 마침, 이 알고리즘을 깔끔하게 정리한 글이 있어 공유해 봅니다. 데이터 영역에 관심있는 분들 뿐만 아니라 머신러닝이나 AI에 관심있는 분들은 원문을 꼭 일독하시길 강추(!)합니다~^^ 📜 지도학습 👉 선형회귀, 로지스틱 회귀, K-최근접 이웃, 나이브 베이즈, 결정 트리, 랜덤 포레스트, XG부스트, 라이트GBM, 📜 비지도학습 👉 K-평균 군집화, 주성분 분석(PCA) 🔔 선형 회귀(Linear Regression) 🚩 문제 유... 더 보기

    확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 | 요즘IT

    요즘IT

    확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 | 요즘IT

     • 

    저장 96 • 조회 3,662


    데이터 분석가의 뇌구조가 궁금하다면?

    ... 더 보기

    [광고] 다음 직무 채용 예정입니다.


    - 프러덕트/사업 기획 1인

    - 프러덕트 디자인 1인

    ... 더 보기

    < 서비스를 중독성 있게 만드는 결정적 원리 >

    1. 진통제이면서 비타민이어야 한다.

    ... 더 보기