[230830] 모두의연구소가 전하는 "모두를 위한 AI 뉴스"

모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다🌱. 그럼, 오늘의 AI 뉴스 시작해 볼게요! 🙂 1️⃣ Nougat: 과학 문서의 PDF를 마크업 언어로 변환하는 광학 문자 인식 모델 과학 문서는 주로 PDF로 저장되지만, 이 형식은 정보가 쉽게 손실될 수 있는 위험이 있죠. 오늘 가져온 논문에서는 과학 문서를 마크업 언어로 변환하기 위한 광학 문자 인식 모델인 Nougat을 소개하였습니다. 이 모델은 읽기 어려운 문서를 기계가 읽을 수 있는 텍스트로 변환하여 과학 지식의 접근성을 향상시키는 것을 목표로 합니다. 이를 위해 제작된 모델과 코드는 공개될 예정이라고 합니다! → https://huggingface.co/papers/2308.13418 2️⃣ OmniQuant: LLM을 위한 전방향 보정 양자화 기법의 소개 대규모 언어 모델(LLM)의 배포는 큰 메모리와 계산 요구 사항 때문에 어려움이 있죠. 기존 학습 후 양자화(PTQ) 방식은 이 문제를 부분적으로 해결하였지만 한계가 있었기 때문인데요. 이를 극복하기 위해 유니티는 LLM을 위한 전방향 보정 양자화(OmniQuant) 기법을 도입했다고 합니다! OmniQuant는 학습 가능한 가중치 클리핑과 학습 가능한 등가 변환 두 가지 주요 구성 요소로 작동하며, LLM의 양자화 프로세스를 효율적으로 최적화합니다. 이 기법은 다양한 양자화 구성에서 우수한 성능을 보이며, 실제 장치에서 추론 속도와 메모리 사용량을 크게 줄일 수 있다고 합니다! → https://huggingface.co/papers/2308.13137 3️⃣ SoTaNa: 향상된 ChatGPT와 LLaMA를 기반으로 한 오픈소스 소프트웨어 개발 어시스턴트 소프트웨어 개발은 현대 사회의 혁신과 효율성을 촉진하는 중요한 분야로, 효과적인 개발 어시스턴트의 수요가 증가하고 있습니다. 대규모 언어 모델인 ChatGPT와 LLaMA는 제한적인 접근성과 의도 파악 어려움이 있는데요. 이를 해결하기 위해 SoTaNa, 오픈소스 소프트웨어 개발 어시스턴트를 소개하며, ChatGPT를 기반으로 LLaMA 모델을 향상시키는 방식을 채택합니다. 스택 오버플로의 질문 응답 효율성과 코드 요약 및 생성 기능을 평가하며, 단일 GPU에서도 실행 가능함을 강조한다고 합니다! → https://huggingface.co/papers/2308.13416 📍 오늘까지만! 아이펠 6기 앵콜 모집 중 AI학교 아이펠 지금 바로 지원하기 → https://bit.ly/3YDkLV4 #모두를위한AI뉴스 #AI뉴스 #AI트렌드 #모두의연구소 #아이펠

[230830] 모두의연구소가 전하는 "모두를 위한 AI 뉴스"

알림