넥스트 LLM 애플리케이션에 사용할 오픈소스 LLM TOP 10

오픈AI가 ChatGPT를 출시한 후 지난 10개월 동안 대규모 언어 모델 기반 애플리케이션(Large language model-based applications)이 큰 인기를 끌었습니다. 그 이후로 많은 회사와 스타트업이 LLM을 기반으로 하는 애플리케이션(App)과 제품을 출시하고 있습니다. 하지만 GPT4 등 상업적 용도로 사용 가능한 LLM을 사용하는 것은 장기적으로 비용이 매우 많이 들 수 있고, 이에 대한 대안으로 오픈 소스 LLM이 있습니다. 이번 공유 기사는 차기(Next) LLM 기반 App에 사용할 수 있는 가장 강력한 오픈 소스 LLM TOP 10에 대한 기사입니다. <차기 LLM 애플리케이션에 사용할 오픈소스 LLM TOP 10> 1. LLaMA - 70억에서 650억 개의 파라미터에 이르는 다양한 크기의 다양한 언어 모델로 구성 - 공개적으로 사용 가능한 데이터 세트만 사용하여 수백만 개의 토큰에 대해 학습됨 - LLaMA-13B 모델은 GPT-3(175B)보다 성능이 좋은 반면, LLaMA-65B는 Chinchilla-70B, PaLM-540B.3,7B 등 최상위 모델과 동등한 성능을 보임 > License: Apache 2.0 > Release Date: May 5, 2023 > Github: https://github.com/openlm-research/open_llama 2. Falcon - Falcon AI(주로 Falcon LLM 40B)는 UAE의 기술 혁신 연구소(TII)에서 출시한 LLM임 - 40B는 이 LLM에서 사용되는 400억 개의 매개변수를 나타냄 - TII는 심지어 15000억 개의 토큰에 대해 훈련된 70억 개의 매개변수 모델인 7B를 개발함 - Falcon LLM 40B 모델은 RefinedWeb의 1조 토큰에 대해 학습되었음 - 이 LLM이 다른 LLM과 다른 점은 이 모델이 투명하고 오픈 소스라는 점임 - 자동 회귀 디코더 전용 모델이며, Falcon AI의 학습은 384개의 GPU가 연결된 AWS 클라우드에서 2개월 동안 지속적으로 진행됨 - 사전 학습 데이터는 주로 공개 데이터로 구성되었으며 연구 논문 및 소셜 미디어 대화에서 가져온 데이터 소스는 거의 없다고 함 3. Dolly - Dolly 2.0은 Databricks의 LLM - EleutherAI Pythia 모델 제품군(family)을 기반으로 하며 인간이 생성한 고품질 명령 데이터 세트로 파인튜닝(fine-tuned)됨 - Dolly 2.0은 상업적 용도로 사용 가능하며 요약, 콘텐츠 생성, 질문 답변 등 다양한 작업에 사용 가능 > License: Apache 2.0 > Release Date: Apr 12,2023 > Github: https://www.databricks.com/blog/2023/04/12/dolly-first-open-commercially-viable-instruction-tuned-llm 4. Guanaco - UW NLP 그룹의 Tim Dettmers 등이 개발한 LoRA라는 finetuning 방법을 사용하는 LLM - QLoRA를 사용하면 16비트 모델에 비해 성능 저하 없이 48GB GPU에서 최대 65B 매개변수 모델을 미세 조정할 수 있음 - Guanaco 모델 제품군은 Vicuna 벤치마크에서 이전에 출시된 모든 모델보다 성능이 뛰어남. 그러나 해당 모델은 LLaMA 모델 제품군을 기반으로 하기 때문에 상업적 사용이 허용됨 > License: MIT > Release Date: May 24, 2023 > Github: https://github.com/artidoro/qlora 5. Bloom - 프롬프트(prompt)에서 텍스트를 계속하고 완성하도록 학습되었기 대문에 본질적으로 텍스트를 생성하는 과정임(completion, generation, continue) - BLOOM은 46개 언어와 13개 프로그래밍 언어로 텍스트를 생성 가능하다고 함 > License: Apache 2.0 > Release Date: Apr 19,2023 > Github: https://github.com/bigscience-workshop/xmtf#models 6. Alpaca - Alpaca는 Meta의 LLaMA 7B 모델에서 미세 조정되었으며, text-davinci-003을 사용하여 자체 지시 스타일로 생성된 52K 지시에 따른 데모를 통해 학습됨 - Self-Instruct 평가 세트에서 Alpaca는 OpenAI의 text-davinci-003과 유사한 많은 동작을 보여 주지만 놀라울 정도로 작고 재현하기 쉽고 저렴하다고 함 > License: Apache 2.0 > Release Date: Mar 13, 2023 > Github: https://github.com/tatsu-lab/stanford_alpaca 7. OpenChatKit - OpenChatKit은 일반화되고 전문화된 챗봇 App을 생성할 수 있는 강력한 오픈 소스 도구 세트를 제공 - Together Computer는 소스 코드, 모델 가중치 및 훈련 데이터 세트가 포함된 Apache-2.0 라이센스에 따라 OpenChatKit 0.15를 출시함 8. GPT4ALL - GPT4All은 무료로 사용할 수 있는 챗봇 웹사이트 - 로컬에서 실행되며 개인 정보를 존중하므로 사용하기 위해 GPU나 인터넷 연결이 필수가 아님 - cunsumer-grade CPU에서 원활하게 실행 - 4GB GPT4All 모델을 다운로드하여 오픈 소스 GPT4All 에코시스템 소프트웨어와 연결할 수 있으며, Nomic AI는 안전하고 최고의 소프트웨어 생태계를 보장 > License: MIT > Release Date: Apr 24,2023 > Github: https://github.com/nomic-ai/gpt4all 9. Vicuna - Vicuna-13B는 ShareGPT에서 수집한 사용자 공유 대화에서 LLaMA를 미세 조정하여 학습된 오픈 소스 챗봇 - GPT-4를 심사위원으로 사용한 예비 평가에서는 Vicuna-13B가 OpenAI ChatGPT 및 Google Bard의 90%* 이상의 품질을 달성하는 동시에 90%* 이상의 사례에서 LLaMA 및 Stanford Alpaca와 같은 다른 모델을 능가하는 것으로 나타남 10. Flan-T5 - Flan-T5-XXL은 지침으로 표현된 데이터세트 모음에서 T5 모델을 미세 조정함 - 명령어 미세 조정을 통해 PaLM, T5, U-PaLM 등 다양한 모델 클래스의 성능이 획기적으로 향상더되었다고 함 - Flan-T5-XXL 모델은 더 많은 언어를 다루는 1000개 이상의 추가 작업에 대해 미세 조정되었음 > License: Apache 2.0 > Release Date: Apr 28,2023 > Github: https://github.com/lm-sys/FastChat#FastChat-T5 원본 기사 링크는 아래와 같습니다. 감사합니다🙏 [Source Link] https://pub.towardsai.net/top-10-open-source-llms-to-use-in-your-next-llm-application-fbfc51542b78

Top 10 Open Source LLMs To USE In Your Next LLM Application

Medium

Top 10 Open Source LLMs To USE In Your Next LLM Application

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 8월 28일 오전 9:56

댓글 0

    함께 읽은 게시물

    < PM/PO 커리어 3단계: 당신은 How, What, Why 중 어디

    1. PM/PO 커리어는 3개의 단계로 나눠 생각해 볼 수 있다. 그 세가지는 일을 할 때 거치는 3단계와도 같다. 일의 3단계는 무얼까.

    ... 더 보기

    이제 스티브 잡스의 남자가 아니라 샘 올트만의 남자라고 해야 할까요. 조니 아이브가 스타트업들에게 전하는 조언입니다. 그는 여전히 애플 때와 마찬가지로 자신의 일이 인류를 위한 일이라고 믿고, 제품 너머에 있는 사용자의 설렘을 같이 느끼면서 디자인하고 있습니다. 그러면서 다른 스타트업 창업자들에게 좋은 본보기를 만들고 있죠. 하지만 실리콘 밸리는 이제 돈과 권력으로만 움직이는 장소가 되지 않았나 아쉬움을 토로해요.

    ... 더 보기

    ‘스티브 잡스의 남자’ 조니 아이브, 스타트업들 향한 쓴소리

    AI로 쓰는 경력기술서, 자소서

    ‘스티브 잡스의 남자’ 조니 아이브, 스타트업들 향한 쓴소리

    면접 합격을 위한 오버액션 #면접 #면접합격

    ... 더 보기

    “직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던가, 이 일이 날 성장시킨다던가, 이 일이 좋다던가, 이게 다 여기에 해당합니다.“ 박웅현 TBWA 코리아 조직문화연구소 소장은 직원들을 조직에 남게하는 방법을 이렇게 제안했다.

    ... 더 보기

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    뉴시스

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    “내가 아무리 노력해도 안 바뀌어요.” 조직문화나 구성원 얘기를 꺼낼 때 종종 들리는 말이다. 그런데 이 말이 단순한 하소연을 넘어 “이젠 직원들에게 마음을 닫았다”라는 선언처럼 들릴 때가 있다. 문제는 바로 거기에 있다.

    ... 더 보기

    [명대성의 소통 본색] 조직은 리더의 태도를 닮는다

    한국강사신문

    [명대성의 소통 본색] 조직은 리더의 태도를 닮는다

    조회 315


    < 길을 잃기 위해 도서관에 갑니다 >

    1. 이 세계에 존재하는 책의 99.99%를 저는 아직 읽은 적이 없습니다. 그 사실 앞에서 망연자실해집니다.

    ... 더 보기