[1002]모두에게 전하는 모두연 AI뉴스!

  • LLM 다이어트, 훈련 없이 성공! - 혁신적인 아키텍처 탐색 프레임워크

이 논문에서는 대규모 언어 모델(LLM)의 효율성을 높이기 위해 훈련 없는 아키텍처 탐색 프레임워크를 제안합니다. 기존 모델 압축 기법들이 가중치 최적화에 집중하는 것과 달리, 이 프레임워크는 최적의 서브넷을 찾아 추론 속도를 높이는 데 중점을 둡니다. 먼저 가중치 중요도를 계산하여 적절한 초기 아키텍처를 식별하고, 진화 기반 알고리즘을 통해 효율적인 서브넷을 탐색합니다. 각 세대에서는 마스크 변형 알고리즘을 통해 세밀한 채널 인덱스를 식별하고, 적은 수의 훈련 샘플로 후보 아키텍처를 평가하여 효율성을 높입니다. 또한, 선택되지 않은 가중치를 활용하여 서브넷의 가중치를 교정하는 재구성 알고리즘을 도입하여 성능을 향상시킵니다. 실험 결과, 이 방법은 다양한 데이터셋과 LLM 모델에서 최신 구조 가지치기 기법보다 우수한 성능을 보였으며, GPU 메모리 사용량 감소 및 추론 가속화를 달성했습니다.


https://arxiv.org/abs/2409.17372


  • LLM 훈련 속도, 1.5배 UP! DropBP로 효율적인 딥러닝

이 논문에서는 훈련 과정의 계산 비용을 줄이기 위해 역전파 과정에서 레이어를 무작위로 생략하는 DropBP(Dropping Backward Propagation) 기법을 제안합니다. DropBP는 역전파 시에만 레이어를 생략하여 순전파 과정에서 발생하는 출력 변화를 방지하고, 각 레이어의 민감도를 계산하여 드롭률을 조정함으로써 안정적인 훈련을 보장합니다. DropBP는 풀 파인튜닝 및 파라미터 효율적인 파인튜닝 모두에 적용 가능하며, LLaMA2-70B에서 QLoRA를 사용할 때 훈련 시간을 44% 단축하고 동일한 손실 수준까지의 수렴 속도를 1.5배 향상시키는 등 긍정적인 결과를 보였습니다. 또한, GPU 메모리 사용량을 줄여 훈련 가능한 최대 시퀀스 길이를 6.2배까지 늘릴 수 있었습니다.


https://arxiv.org/abs/2402.17812


AI학교 아이펠에서 최신 AI연구를 완성해보세요! https://bit.ly/3Y0ZO7Q
AI엔지니어 선배팅 : https://forms.gle/d35G1TMSvdFPXFSdA

Search for Efficient Large Language Models

arXiv.org

Search for Efficient Large Language Models

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 10월 2일 오전 6:28

댓글 0

    함께 읽은 게시물

    무너지고 있는 프론트엔드, 백엔드 직군의 경계에 대한 고찰

    AI 기술이 우리 일상과 산업 전반에 스며들면서 소프트웨어 개발 환경 역시 큰 변화의 물결을 맞이하고 있다. 특히 코딩을 돕는 AI 에이전트의 등장은 개발 생산성에 대한 큰 변화를 만들고 있다. 나 역시 이러한 변화를 체감하며, 나에게 익숙한 소프트웨어 개발의 대표적인 두 축인 프론트엔드와 백엔드 영역에서 AI 기술이 미치는 영향과 그로 인해 변화하는 소프트웨어 엔지니어의 역할에 대해 개인적인 생각을 정리해 본다.

    ... 더 보기

     • 

    저장 32 • 조회 4,074


    데이터 분석가 커리어 만들기[#2 tools 편] BI

    R과 파이썬은 비교하는 이야기는 비교 관점 보다는 어떻게 공부하고 사용하면 좋을지 이야기 하고싶다. 비교는 하지 않으려고 한다. (이유는 #1 편 참고 ) 상용 BI tool은 트렌드를 반영하며 지속적으로 기능이 업그레이드 되고 있다. 프리세일즈도 했었기에 가장 근거를 많이 삼는 사이트를 소개하면 비교 해보고자 한다. BI tool를 다 나열하면 너무 많기 때문에 경험상 비교 되었던 몇 가지 툴을 비교하려고 한다. 아래 tool은 self BI tool로 국내 사이트에서 가장 많이 비교 검토 대상이 되었다. 각 tool의 장단점이 있고 QlikView 를 제외하고는 사용해보았다. (스킬 수준은 다르지만) Spotfire VS Tableau VS Power BI 1. Tool 비교 사이트 대부분 가트너를 가장 신뢰하는 사이트인지 각 업체마다 가트너를 레퍼런스로 내세우며 비교 한다. 가트너: https://www.gartner.com/reviews/market/analytics-business-intelligence-platforms 참고 URL: https://www.finereport.com/en/bi-tools/top-5-bi-tools-of-201... 더 보기

     • 

    저장 20 • 조회 6,858


    Dependabot을 통한 안전한 의존성 관리

    ... 더 보기

    개발자의 장애 공유 문화

    ... 더 보기

    개발자의 장애 공유 문화

    K리그 프로그래머

    개발자의 장애 공유 문화

     • 

    저장 14 • 조회 3,570