Kimjeongeun

모두의연구소 아이펠캠퍼스 퍼실리테이터

[1004]모두에게 전하는 모두연 AI뉴스!

숨겨진 이미지 정보의 보고, AltText! 멀티모달 모델 성능 향상의 비밀

이 논문에서는 멀티모달 모델의 성능 향상을 위해 이미지 캡션 데이터, 특히 웹에서 수집된 AltText와 합성 캡션을 활용하는 방법을 연구했습니다. AltText는 이미지-텍스트 정렬도는 낮지만 다양한 정보를 제공하며, 합성 캡션은 정렬도를 높여 성능 향상에 기여합니다. CLIP, 멀티모달 LLM, Diffusion 모델에 대한 실험 결과, 각 모델은 선호하는 캡션 형식이 다르다는 것을 확인했습니다. 멀티모달 모델의 성능을 극대화하려면 AltText와 합성 캡션을 적절히 혼합하고 모델에 맞는 캡션 형식을 사용해야 합니다.

https://huggingface.co/papers/2410.02740

AI 드림팀 결성! Agglomerative Model로 최강 AI 탄생

이 논문에서는 여러 인공지능 모델을 하나로 합쳐서 더 똑똑한 모델을 만드는 방법을 연구했습니다. 각 모델마다 잘하는 분야가 다른데, 이 장점들을 모아서 하나의 모델로 만드는 거죠. 마치 여러 명의 선생님에게 배우는 것과 같은 원리인데, 이를 'Agglomerative Model'이라고 정의합니다. 연구진들은 다양한 방법을 시도했는데, 그 중에서도 'PHI Standardization (PHI-S)'라는 기술이 가장 효과적이었습니다. PHI-S는 각 모델의 특징을 균등하게 조정해서, 하나의 모델로 잘 합쳐지도록 돕는 역할을 했습니다. 이 기술 덕분에 새로 만들어진 모델은 이미지 인식, 이미지 분류 등 다양한 작업에서 더 뛰어난 성능을 보여주었습니다.

https://huggingface.co/papers/2410.01680

AI학교 아이펠에서 최신 AI연구를 완성해보세요! https://bit.ly/3Y0ZO7Q
AI엔지니어 선배팅 : https://forms.gle/d35G1TMSvdFPXFSdA

Paper page - Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models

huggingface.co

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 10월 4일 오전 7:06

함께 읽은 게시물

HoJoong Kim

Senior IT guy

2024년 02월 29일

2024년 최고의 데이터분석 자격증

데

7 Best Data Analytics Certification Options For 2024

Datamation

•

저장 32 • 조회 2,720

한기용

UpZen 창업자 대표 & 산호세 주립대 교수

2024년 09월 18일

데이터 이야기 #4: 기본 데이터 직군 - 데이터 분석가

앞서 포스팅에서는 데이터 팀의 목적이 무엇이고 어떻게 가치를 생성하는지 이야기해보았다. 이번 포스팅에서는 기본 데이터 직군이라 할 수 있는 데이터 엔지니어, 데이터 분석가, 데이터 과학자에 대해 이야기해보고자 한다.

댓글 1 • 저장 9 • 조회 3,485

데이터리안

Data Analyst

2023년 06월 20일

데이터 분석가로 취업은 했는데 분석은 못하고 쿼리 머신이 되는 것 같아요

데이터 분석가 취업, 이직, 커리어와 관련된 고민, 걱정 물어볼 곳이 없어 속으로만 삭히고 계신가요? 현업 데이터 분석가 선배들에게 무엇이든 물어보세요. 이 세미나에 관심 있을 것 같은 동료, 친구, 지인이 있다면 세미나 소식을 공유해주세요 :) 세미나 자세히 알아보기 👉 https://bit.ly/3Zn3Yor [ 지금까지 들어온 질문들 ] ✔ 데이터 분석가의 업무 범위는 어느 정도 될까요? ✔ 데이터 분석가가 되기 위해 하셨던 공부는 어떤 것이 있을까요? 도움을 받은 책은 무엇일까요? ✔ 데이터 분석가로 취업... 더 보기

저장 5 • 조회 1,782

석민

커리어 코치

6월 8일

전략적 입사 지원

전

•

저장 19 • 조회 1,392

김수진

Community content manager

2023년 11월 18일

[서평] 주니어가 읽기 좋은 책 <데이터 드리븐 리포트>

데

데이터 드리븐 리포트

Hanbit

•

저장 1 • 조회 315

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

4일 전

“직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던가, 이 일이 날 성장시킨다던가, 이 일이 좋다던가, 이게 다 여기에 해당합니다.“ 박웅현 TBWA 코리아 조직문화연구소 소장은 직원들을 조직에 남게하는 방법을 이렇게 제안했다.

박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

뉴시스

저장 8 • 조회 1,047

비슷한 게시물

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[1028]모두에게 전하는 모두연 AI뉴스!

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

datarichard 블로그 페이지를 만들었습니다.

SNEW 스타트업 뉴스 start-up and VC

리벨리온, 딥엑스, 퓨리오사AI

골빈해커 Chief Maker

Artificial General Intelligence 어학원

서진호 sr. Presales Solution Architect, HPC&AI

<진보된 시각 처리를 해 주는 멀티 모달 모델, Grok 1.5 비전>

골빈해커 Chief Maker

OpenAI의 가장 큰 강점은 ChatGPT를 가장 먼저 시작했을 뿐 아니라, 가장 폭넓은 사용자층을 통해 대화 형식의 데이터를 가장 모은 데이터에 있다는 것인데요.

주간 인기 TOP 10

psmon 웹노리라이터

구현패턴으로 DB사용비용을 10배줄이기

K리그 프로그래머 커피한잔 개발자

1인 개발자의 최고의 사무실은 바로 자기집 방구석

한기용 UpZen 창업자 대표 & 산호세 주립대 교수

Airflow 3.0 주요 기능 소개

석민 커리어 코치

전략적 입사 지원

달레 Apollo GraphQL Software Engineer

🧊 급격하게 얼어붙고 있는 해외 취업 시장 🥶

김의중 프론트엔드 개발자

"마케팅을 바꾸는 데이터의 힘"을 읽고 정리해본 마케팅/데이터 개

조찬우 Coupang Sr. iOS Engineer

좋은 개발자는 환경이 만든다

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

엔지니어링의 핵심, 유지 보수가 가능한 파이프라인 구성하기

하조은 당근 Product Engineer

발이 닿지 않는 바다에서

장홍석 스페이스오디티 부대표/CPO

< AI의 '환각'보다 무서운, 내가 만드는 '환상' >

[1004]모두에게 전하는 모두연 AI뉴스!

댓글 0

함께 읽은 게시물

2024년 최고의 데이터분석 자격증

데이터 이야기 #4: 기본 데이터 직군 - 데이터 분석가

데이터 분석가로 취업은 했는데 분석은 못하고 쿼리 머신이 되는 것 같아요

전략적 입사 지원

[서평] 주니어가 읽기 좋은 책 <데이터 드리븐 리포트>

비슷한 게시물

주간 인기 TOP 10

추천 프로필