김성혁

테크 리드

[2309011] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

🩵 모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다. 그럼, 오늘의 AI 뉴스 시작해 볼게요! :) 1️⃣ CM3Leon: 검색 증강 토큰 기반의 효율적 멀티모달 언어 모델 (https://huggingface.co/papers/2309.02591) CM3Leon(“카멜레온“)은 텍스트와 이미지를 모두 생성하고 채울 수 있는 검색 증강 토큰 기반의 멀티모달 언어 모델로, CM3 멀티모달 아키텍처를 기반으로 다양한 명령어 스타일 데이터를 확장 및 튜닝하였습니다. 이 모델은 대규모 검색 증강 사전 훈련과 다중 작업 감독 미세 조정 단계를 통해 훈련되었으며, 텍스트-이미지 및 이미지-텍스트 생성을 모두 처리할 수 있습니다. 이 모델은 훈련 연산이 적게 들면서도 최첨단 성능을 제공하며 다양한 이미지 관련 작업에서 뛰어난 제어 능력을 보여줍니다. 2️⃣ SLiMe: 단일 주석 샘플을 활용한 혁신적 이미지 세분화 방법 (https://huggingface.co/papers/2309.03179) 다양한 다운스트림 작업에서 대규모 비전 언어 모델인 스테이블 디퓨전(SD)의 활용에 큰 진전이 있었습니다. 이를 바탕으로 저희는 SLiMe라는 방법을 제안하여 단 하나의 주석이 달린 샘플만을 사용하여 이미지를 세분화할 수 있도록 했습니다. SLiMe는 훈련 이미지와 해당 세분화 마스크로부터 어텐션 맵을 추출하고, 그 맵을 활용해 텍스트 임베딩을 최적화하여 이미지 내 분할된 영역을 학습합니다. 이 학습된 임베딩은 이미지를 세분화하는데 사용되며, 추가 학습 데이터가 있다면 SLiMe의 성능이 더욱 향상됩니다. 실험을 통해 SLiMe가 기존의 원샷 및 소수 샷 분할 방법보다 더 우수한 성능을 보였습니다. 3️⃣ OPRO: 대규모 언어 모델을 활용한 자연어 기반 최적화 방식 (https://huggingface.co/papers/2309.03409) 이 논문은 큰 언어 모델들을 최적화 도구로 사용하는 방법에 대해 논의합니다. 저자들은 Optimization by PROmpting (OPRO)라는 방법을 제안하며, 이 방법은 큰 언어 모델들을 최적화 도구로 사용하여 최적화 작업을 자연어로 설명하는 것을 기반으로 합니다. 각 최적화 단계에서, 언어 모델은 이전에 생성된 솔루션과 그 값이 포함된 프롬프트에서 새로운 솔루션을 생성합니다. 이후 새로운 솔루션은 평가되고 다음 최적화 단계를 위해 프롬프트에 추가됩니다. 이 연구는 선형 회귀와 여행자의 문제와 같은 전통적인 최적화 문제에 대한 사례 연구를 제시하며, 다양한 언어 모델을 사용하여 OPRO에 의해 최적화된 최상의 프롬프트가 GSM8K에서 최대 8%까지, Big-Bench Hard 작업에서 최대 50%까지 성능을 향상시킨다는 것을 보여줍니다. 📍AI학교 아이펠 7기 무료 입학하기! → https://bit.ly/3YDkLV4

AI학교 아이펠 - 부트캠프와 다른 AI학교

AI학교 아이펠

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 9월 11일 오전 7:15

저장 1 • 조회 732

함께 읽은 게시물

이양일

NaverCloud 백엔드 개발자

2023년 05월 20일

주니어 개발자들이 읽으면 좋은 테크 아티클 모음📚

F-Lab 에서 주니어 개발자들이(사실 개발자라면 누구나) 보시면 좋을 아티클 모음을 공유해 주었네요! 검색엔진부터 비동기 처리, NoSQL 등 다양한 분야의 아티클들이 공유되어 있으니 관심있으신 분들은 보시면 좋겠습니다. F-Lab 에서 공유해주신 아티클 주제를 나열해보면 다음과 같습니다. 📌 구글이 직접 말하는 검색엔진의 원리 (tali.kr) 📌 검색 엔진은 어떻게 작동하는가 (xo.dev) 📌 네이버의 검색엔진의 특징과 알고리즘 (tistory.com) 📌 [네이버 블로그]네이버 검색의 원리 : 네이버 블... 더 보기

주니어 개발자들이 읽으면 좋은 테크 아티클 모음

F-Lab : 상위 1% 개발자들의 멘토링

•

저장 145 • 조회 3,989

박성국

테크니컬 아티스트

3일 전

괴물은 하루아침에 태어나지 않는다

큰 것을 하는 것보다 매일 작은 것을 완벽하게 해내는 노력이 더 중요하다. 내가 성격 장애의 하나인 자기애성 성격장애자(NPD, Narcissistic Personality Disorder)를 만나면서 느낀 것은, 처음에는 그런 사람도 "정상인"처럼 느껴진다는 것이었다. 다만 그의 미친짓은 내가 매일매일 "사소한" 사건들로 상대방에게 익숙해졌을 때 발생한다.

저장 2 • 조회 420

김의중

프론트엔드 개발자

3일 전

Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

최

쿠버네티스를 활용한 클라우드 네이티브 데브옵스 | 존 어런들 - 교보문고

product.kyobobook.co.kr

•

저장 16 • 조회 1,563

달레

Apollo GraphQL Software Engineer

2일 전

🌎 해외에서 일하면 뭐가 좋을까요❓

외국어를 사용해서? 돈을 더 많이 벌어서? 새로운 기회가 많아서? 글로벌 경력을 쌓을 수 있어서?

댓글 1 • 저장 5 • 조회 2,054

평비

LGCNS 백엔드 개발자

2일 전

5년만에 최저치를 기록한 SW 개발자 채용

다

5년만에 최저치를 기록한 SW 개발자 채용 공고

개발자 취업 비법

저장 4 • 조회 1,463

psmon

웹노리라이터

4일 전

서버엔지니어의 시대적 고민

서

저장 13 • 조회 1,959

비슷한 게시물

조성래 Seonglae Cho

Sonnet이 GPT4 성능을 따라잡은 이유??

서진호 sr. Presales Solution Architect, HPC&AI

<생성형 AI 개발 프로세스는?>

김성혁 테크 리드

[230920] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

소성은 Gen AI Field Solution Architect @ Google

claude 3.5 sonnet 공개

백선환 AWS/ AIML Specialist

클로드 모델 RAG 리더보드 1위

골빈해커 Chief Maker

📰 OpenAI, 50% 저렴한 Batch API 출시

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

[2309011] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

댓글 0

함께 읽은 게시물

주니어 개발자들이 읽으면 좋은 테크 아티클 모음📚

괴물은 하루아침에 태어나지 않는다

Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

🌎 해외에서 일하면 뭐가 좋을까요❓

5년만에 최저치를 기록한 SW 개발자 채용

서버엔지니어의 시대적 고민

비슷한 게시물

주간 인기 TOP 10

추천 프로필