[2309011] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

🩵 모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다. 그럼, 오늘의 AI 뉴스 시작해 볼게요! :) 1️⃣ CM3Leon: 검색 증강 토큰 기반의 효율적 멀티모달 언어 모델 (https://huggingface.co/papers/2309.02591) CM3Leon(“카멜레온“)은 텍스트와 이미지를 모두 생성하고 채울 수 있는 검색 증강 토큰 기반의 멀티모달 언어 모델로, CM3 멀티모달 아키텍처를 기반으로 다양한 명령어 스타일 데이터를 확장 및 튜닝하였습니다. 이 모델은 대규모 검색 증강 사전 훈련과 다중 작업 감독 미세 조정 단계를 통해 훈련되었으며, 텍스트-이미지 및 이미지-텍스트 생성을 모두 처리할 수 있습니다. 이 모델은 훈련 연산이 적게 들면서도 최첨단 성능을 제공하며 다양한 이미지 관련 작업에서 뛰어난 제어 능력을 보여줍니다. 2️⃣ SLiMe: 단일 주석 샘플을 활용한 혁신적 이미지 세분화 방법 (https://huggingface.co/papers/2309.03179) 다양한 다운스트림 작업에서 대규모 비전 언어 모델인 스테이블 디퓨전(SD)의 활용에 큰 진전이 있었습니다. 이를 바탕으로 저희는 SLiMe라는 방법을 제안하여 단 하나의 주석이 달린 샘플만을 사용하여 이미지를 세분화할 수 있도록 했습니다. SLiMe는 훈련 이미지와 해당 세분화 마스크로부터 어텐션 맵을 추출하고, 그 맵을 활용해 텍스트 임베딩을 최적화하여 이미지 내 분할된 영역을 학습합니다. 이 학습된 임베딩은 이미지를 세분화하는데 사용되며, 추가 학습 데이터가 있다면 SLiMe의 성능이 더욱 향상됩니다. 실험을 통해 SLiMe가 기존의 원샷 및 소수 샷 분할 방법보다 더 우수한 성능을 보였습니다. 3️⃣ OPRO: 대규모 언어 모델을 활용한 자연어 기반 최적화 방식 (https://huggingface.co/papers/2309.03409) 이 논문은 큰 언어 모델들을 최적화 도구로 사용하는 방법에 대해 논의합니다. 저자들은 Optimization by PROmpting (OPRO)라는 방법을 제안하며, 이 방법은 큰 언어 모델들을 최적화 도구로 사용하여 최적화 작업을 자연어로 설명하는 것을 기반으로 합니다. 각 최적화 단계에서, 언어 모델은 이전에 생성된 솔루션과 그 값이 포함된 프롬프트에서 새로운 솔루션을 생성합니다. 이후 새로운 솔루션은 평가되고 다음 최적화 단계를 위해 프롬프트에 추가됩니다. 이 연구는 선형 회귀와 여행자의 문제와 같은 전통적인 최적화 문제에 대한 사례 연구를 제시하며, 다양한 언어 모델을 사용하여 OPRO에 의해 최적화된 최상의 프롬프트가 GSM8K에서 최대 8%까지, Big-Bench Hard 작업에서 최대 50%까지 성능을 향상시킨다는 것을 보여줍니다. 📍AI학교 아이펠 7기 무료 입학하기! → https://bit.ly/3YDkLV4

AI학교 아이펠 - 부트캠프와 다른 AI학교

AI학교 아이펠

AI학교 아이펠 - 부트캠프와 다른 AI학교

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 9월 11일 오전 7:15

댓글 0

    함께 읽은 게시물

    주니어 개발자들이 읽으면 좋은 테크 아티클 모음📚

    F-Lab 에서 주니어 개발자들이(사실 개발자라면 누구나) 보시면 좋을 아티클 모음을 공유해 주었네요! 검색엔진부터 비동기 처리, NoSQL 등 다양한 분야의 아티클들이 공유되어 있으니 관심있으신 분들은 보시면 좋겠습니다. F-Lab 에서 공유해주신 아티클 주제를 나열해보면 다음과 같습니다. 📌 구글이 직접 말하는 검색엔진의 원리 (tali.kr) 📌 검색 엔진은 어떻게 작동하는가 (xo.dev) 📌 네이버의 검색엔진의 특징과 알고리즘 (tistory.com) 📌 [네이버 블로그]네이버 검색의 원리 : 네이버 블... 더 보기

    주니어 개발자들이 읽으면 좋은 테크 아티클 모음

    F-Lab : 상위 1% 개발자들의 멘토링

    주니어 개발자들이 읽으면 좋은 테크 아티클 모음

     • 

    저장 145 • 조회 3,989


    괴물은 하루아침에 태어나지 않는다

    큰 것을 하는 것보다 매일 작은 것을 완벽하게 해내는 노력이 더 중요하다. 내가 성격 장애의 하나인 자기애성 성격장애자(NPD, Narcissistic Personality Disorder)를 만나면서 느낀 것은, 처음에는 그런 사람도 "정상인"처럼 느껴진다는 것이었다. 다만 그의 미친짓은 내가 매일매일 "사소한" 사건들로 상대방에게 익숙해졌을 때 발생한다.

    ... 더 보기

    Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

    ... 더 보기

    쿠버네티스를 활용한 클라우드 네이티브 데브옵스 | 존 어런들 - 교보문고

    product.kyobobook.co.kr

    쿠버네티스를 활용한 클라우드 네이티브 데브옵스 | 존 어런들 - 교보문고

     • 

    저장 16 • 조회 1,563


    🌎 해외에서 일하면 뭐가 좋을까요❓

    외국어를 사용해서? 돈을 더 많이 벌어서? 새로운 기회가 많아서? 글로벌 경력을 쌓을 수 있어서?

    ... 더 보기

    5년만에 최저치를 기록한 SW 개발자 채용

    ... 더 보기

    5년만에 최저치를 기록한 SW 개발자 채용 공고

    개발자 취업 비법

    5년만에 최저치를 기록한 SW 개발자 채용 공고

    서버엔지니어의 시대적 고민

    ... 더 보기