[0909]모두에게 전하는 모두연 AI뉴스!

  • 반성하는 언어모델 Reflection, 과연 사기극인까?

HyperWrite에서 4일 전 발표한 새로운 오픈소스 AI 모델인 Reflection 70B가 논란의 중심에 섰습니다. Meta의 Llama 3.1-70B Instruct를 기반으로 개발된 이 모델은 모델이 오류를 자체적으로 인지하고 교정할 수 있는 기법인 Reflection tuning을 사용하였으며, 이를 통해 MMMU, HumanEval 등의 주요 벤치마크에서 우수한 성능을 보여주었다고 주장하였습니다. 다양한 테스트에서 LLaMa 3.1 405B를 능가하고, Claude Sonnet 3.5, GPT4o 등의 상용 모델에 버금가능 성능을 보였고, 많은 연구가들이 hallucination 문제를 해결할 수 있을 것이라고 기대, 출시 이후 굉장한 주목을 받았습니다. 하지만 이에 대해 독립 연구단체 Artificial Analysis를 비롯한 여러 연구자들이 연구 결과의 복제에 실패하였고, 이에 연구 결과가 편향되었을 가능성을 제기하였습니다. HyperWrite에서 제공한 API에서는 모델이 제시한 수치의 동작을 기록하였지만, 허깅페이스 오픈API에서는 MMMU에서 LLaMa 3 70B와 동일한 성능인 79%의 accuracy를 기록하여  LLaMa3.1 70B의 84%보다 심각하게 낮은 성능을
보였으며, GPQA에서도 LLaMa 3.1 70B보다 2포인트, MATH에서도 4포인트 낮은 성능을 보였기 때문입니다. 반응에 대해 HyperWrite CEO는 X를 통해 문제를 발견했고 수정하겠다고 알렸으며, Artificial Analysis는 HuggingFace에 Reflection 70B의 weight가 공개되는 대로 재검증을 계획하고 있다고 밝혔습니다.


https://artificialanalysis.ai/


  • LLM 모듈을 쌓아 구축하는 Foundation Model의 가능성을 보다

모델의 파라메터 수가 점점 커지는 추세의 반면에 제한된 계산 자원을 활용하려는 On-device 니즈가 늘어나는 가운데, 인간 두뇌의 모듈성에서 영감을 받아, LLM을 여러 기능적 모듈로 분해하는 경향이 늘어나고 있습니다. 중국 칭화대, CMU, Stanford, UCLA 등의 공동 연합 연구진들은 이에 LLM에 대한 모듈식 접근법을 제안하였습니다. 각 기능적 모듈을 '벽돌'로 표현하며, 각 모듈을 합쳐 구성 가능한 기초 모델에 대해 조사를 진행한 것입니다. 연구자들은 Pretrained 단계에서 나타나는 기능적 뉴런 파티션인 '창발적 벽돌(emergent bricks)', 그리고 LLM의 능력과 지식을 향상시키기 위해 fine tuning을 통해 구축된 '맞춤형 벽돌(customized bricks)'으로 지칭하며, 모듈의 검색, 라우팅, 병합 등을 함께 조사하였습니다. 이를 통해 연구자들은 자원이 제한된 기기에서의 효율적인 추론,  복잡한 작업을 위한 모듈의 동적 조립, 모듈식 설계를 통한 확장 가능한 능력, 지속적인 모델 업데이트와 개선 가능성을 선보였습니다.


https://arxiv.org/pdf/2409.02877


이론과 실무를 잇-다!
데이터로 비즈니스 가치를 만드는 데이터 사이언티스트 전문 과정 모집 중 : https://bit.ly/3YBFXNf

Model & API Provider Analysis | Artificial Analysis

artificialanalysis.ai

Model & API Provider Analysis | Artificial Analysis

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 9월 9일 오전 8:56

댓글 0

    함께 읽은 게시물

    Mermaid로 쉽게 다이어그램 그리기

    M

    ... 더 보기

    Mermaid로 다이어그램 편하게 그리기

    iOYES

    Mermaid로 다이어그램 편하게 그리기

    [HBR] 관리자가 부정적인 피드백을 줄 때 저지르는 5가지 실수

    ... 더 보기

    5 Mistakes Managers Make When Giving Negative Feedback

    Harvard Business Review

    5 Mistakes Managers Make When Giving Negative Feedback

     • 

    저장 19 • 조회 2,431


    커뮤니티와 함께 성장하는 개발자

    개발자는 커뮤니티와 함께 성장합니다. 개발자는 끊임없이 배우고 성장해야 하는 직업입니다. 최신 기술을 따라잡기 위해서는 항상 새로운 것을 배우고, 다른 개발자들과 교류해야 합니다. 개발자 커뮤니티는 개발자들이 서로 정보를 공유하고, 도움을 주고받을 수 있는 공간입니다. 커뮤니티에 참여함으로써 개발자들은 빠르게 성장할 수 있습니다. 대표적인 커뮤니티를 소개하면 다음과 같습니다. *커리어리 제외! 1. okky: 정말 말 그대로 개발자들의 커뮤니티로, 간단한 잡담부터 업계 얘기, 수많은 경험과 노하우들이 담겨있습니다. 스터디를 모집하는 게시판도 꽤 활성화되어있습니다. 2. 생활코딩: 페이스북 그룹 기반으로 다양한 얘기들이 오갑니다. 페이스북 특성상 가입이 쉬워 눈팅족이 많습니다. 페이스북 기반이기에 광고글이 많은 것은 아쉽습니다. 3. 데보션: sk그룹에서 운영하는 커뮤니티인데, 양질의 컨텐츠가 많이 올라오며, 다양한 행사를 진행함. 소통 공간이 더 있으면 좋을듯합니다. 일반적으로 개발자 커뮤니티는 개발자들에게 많은 것을 제공합니다. 최신 기술을 배우고, 다른 개발자들과 교류하고, 자신의 커리어를 발전시킬 수 ... 더 보기

    코딩과 프로그래밍과 소프트웨어 개발은 다른 것이고, 코딩은 앞으로 대부분은 할 필요가 없어질 것은 맞다고 본다.

    ... 더 보기

     • 

    저장 5 • 조회 3,856


    오픈 소스 라이선스 가이드

    ... 더 보기

    오픈 소스 라이선스 가이드

    www.daleseo.com

    오픈 소스 라이선스 가이드

    Amazon CEO가 얘기하는 성공적인 커리어를 위한 최고의 팁 5가지


    ... 더 보기

    Amazon CEO Andy Jassy shares his top tips for a successful career: ‘Don’t be afraid to fail’

    www.aboutamazon.com

    Amazon CEO Andy Jassy shares his top tips for a successful career: ‘Don’t be afraid to fail’

     • 

    저장 7 • 조회 728