<애플, 새로 공개한 모델이 Mistral 보다 뛰어남>

커리어리 친구들, Apple의 DataComp for Language Models 프로젝트 연구팀이 Hugging Face에 오픈 DCLM 모델 패밀리를 공개했습니다.


패키지에는 7B 및 1.4B 파라미터의 두 가지 주요 모델이 포함되어 있고, 70억(7B) 파라미터 모델은 벤치마크에서 좋은 성능을 보이며, Mistral-7B를 능가하고 Llama 3 및 Gemma와 같은 다른 주요 오픈 모델에 근접한다고 주장했습니다.


이 프로젝트는 모델 가중치, 학습 코드, 사전 학습 데이터셋을 공개하여 진정한 오픈 소스로 만들어져서 여러분들도 사용해 볼 수 있기 때문에 기대합니다.


https://venturebeat.com/ai/apple-shows-off-open-ai-prowess-new-models-outperform-mistral-and-hugging-face-offerings/


Apple shows off open AI prowess: new models outperform Mistral and Hugging Face offerings

VentureBeat

Apple shows off open AI prowess: new models outperform Mistral and Hugging Face offerings

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 7월 24일 오전 10:00

 • 

저장 3조회 1,772

댓글 0

    함께 읽은 게시물


    간만에 재밌게 읽은 기술 포스트

    ... 더 보기

    무진장 힘들었지만 무진장 성장한 개발 이야기

    Medium

    무진장 힘들었지만 무진장 성장한 개발 이야기

    확장성 있는 시스템 설계하기

    ... 더 보기

    확장성 있는 시스템 설계하기 강의 | JYK 매니지먼트 - 인프런

    인프런

    확장성 있는 시스템 설계하기 강의 | JYK 매니지먼트 - 인프런

     • 

    저장 64 • 조회 3,876


    올해로 개발자 생활이 햇수로 20년째다

    2005년 7월에 일을 시작했으니, 올해로 개발자 생활이 햇수로 20년째다. 중간에 공백이 조금씩 있었으니 꽉 채운 스무 해는 아니지만, 숫자가 주는 무게는 여전하다. 20년이라는 시간이 흘렀다는 사실이 새삼 신기하게 느껴진다.

    ... 더 보기

    3D Chart를 소개합니다 (feat. WWDC 2025)

    ... 더 보기

    Bring Swift Charts to the third dimension (feat. WWDC 2025)

    iOYES

    Bring Swift Charts to the third dimension (feat. WWDC 2025)