갓 출시된 Python 상위 호환 언어인 Mojo를 이용해 만든 llama2 추론 프로그램. 이미 만들어져 있던 Python 으로 만든 llama2 추론 프로그램을 포팅 해 보았다는데요. 기존 프로그램보다 무려 250배나 빨라졌다고 합니다. 😳 C로 만든 유명한 추론 프로그램인 llama2.c 보다도 20%가까이 빠르다고 하네요. 물론 기존 Python 스크립트는 최적화가 되어 있지 않은 것으로 보이고, C로 만든 프로그램도 더 빠르게 만들 수 있는 여지가 분명 있지만, 그래도 큰 노력을 들이지 않고도 이정도 성능 향상을 이끌어 낼 수 있다는 것은 확실히 인상적인 결과 것 같습니다. 앞으로 Mojo의 행보가 정말 기대됩니다. https://github.com/tairov/llama2.mojo

GitHub - tairov/llama2.mojo: Inference Llama 2 in one file of pure 🔥

GitHub

GitHub - tairov/llama2.mojo: Inference Llama 2 in one file of pure 🔥

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2023년 9월 12일 오후 2:14

 • 

저장 6조회 1,834

댓글 0

    함께 읽은 게시물

    [Datamation] AI 데이터 분류 마스터링: 궁극의 가이드

    A

    ... 더 보기

    Mastering AI Data Classification: Ultimate Guide

    Datamation

    Mastering AI Data Classification: Ultimate Guide

     • 

    저장 6 • 조회 1,754


    요즘 사람들이 가장 많이 AI를 활용하는 분야 Top 10

    1

    ... 더 보기

    How People Are Really Using Gen AI in 2025

    Harvard Business Review

    How People Are Really Using Gen AI in 2025

     • 

    저장 9 • 조회 1,146


    PM이 이해하면 좋은 지표 개념

    프로덕트 매니저(PM)로 일하면서 늘 지표 이야기를 듣게 됩니다. 대부분 PM은 선행지표(leading indicator)와 후행지표(lagging indicator)의 개념을 잘 이해하고 있습니다. 하지만 선행지표에 영향을 미치는 '인풋(input) 지표, '아웃풋(o

    ... 더 보기

    ChatGPT 버전명 설명

    ChatGPT 사용할 때 어떤 모델을 선택해야할지 망설여집니다. 모델명만 봐서는 어떤게 좋은지 모르겠더라고요.

    ... 더 보기

    훌륭한 데이터 분석가란 어떤 사람인가?

    ‘훌륭한 데이터 분석가란 어떤 사람인가?’에 대해

    ... 더 보기