[1018]모두에게 전하는 모두연 AI뉴스!

  • 웹의 힘을 빌려 AI를 키우다: MultiUI 데이터셋으로 텍스트 기반 시각적 이해 향상

이 논문에서는 텍스트가 풍부한 시각적 이해를 위해 웹페이지 UI를 활용하는 방법을 제안합니다. 텍스트 기반 LLM을 사용하여 웹페이지 UI에서 일반적인 다중 모달 명령어를 합성하고, UI 스크린샷과 쌍을 이루어 다중 모달 모델을 학습합니다. 이를 위해 100만 개의 웹사이트에서 730만 개의 샘플을 포함하는 MultiUI 데이터셋을 소개합니다. MultiUI에서 학습된 모델은 웹 UI 작업에서 뛰어난 성능을 보일 뿐만 아니라 문서 이해, OCR 및 차트 해석과 같은 웹 UI 이외의 작업에도 일반화됩니다. 이러한 결과는 다양한 시나리오에서 텍스트가 풍부한 시각적 이해를 발전시키기 위한 웹 UI 데이터의 광범위한 적용 가능성을 강조합니다.


https://huggingface.co/papers/2410.13824


  • MMED-RAG: 의료 AI, 진단의 정확성을 높이다!

이 논문에서는 의료 영상 언어 모델의 사실성을 향상시키기 위한 다중 모달 RAG 시스템인 MMED-RAG를 제안합니다. MMED-RAG는 도메인 인식 검색 메커니즘, 검색된 컨텍스트 선택을 위한 적응적 보정 방법, 사실적 선호도를 개선하기 위한 RAG 기반 선호도 미세 조정 전략을 포함합니다. 이러한 구성 요소는 RAG 프로세스를 보다 일반적이고 안정적으로 만들어 검색된 컨텍스트를 도입할 때 정렬을 개선합니다. 방사선, 안과, 병리학과 관련된 5개의 의료 데이터 세트에 대한 실험 결과는 MMED-RAG가 의료 VQA 및 보고서 생성 작업에서 Med-LVLM의 사실적 정확도를 크게 향상시킬 수 있음을 보여줍니다.


https://huggingface.co/papers/2410.13085


[마감임박!] AI개발자 과정! 입문자에서 전공자까지! AI학교 아이펠 10기 합류 : https://bit.ly/3Y0ZO7Q

Paper page - Harnessing Webpage UIs for Text-Rich Visual Understanding

huggingface.co

Paper page - Harnessing Webpage UIs for Text-Rich Visual Understanding

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 10월 18일 오전 7:18

댓글 0

    함께 읽은 게시물

    업계에 필요한 사람이 되자

    ... 더 보기

    업계에 필요한 사람이 되자

    Brunch Story

    업계에 필요한 사람이 되자

     • 

    저장 7 • 조회 1,246


    바이브 코딩이야말로 진정한 애자일이 아닌가.

    조회 2,884


    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기

    ... 더 보기

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기 — 라이브러리 제작

    Medium

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기 — 라이브러리 제작

     • 

    저장 39 • 조회 3,250


    요약하며 읽기

    ... 더 보기

    11화 요약하며 읽기

    Brunch Story

    11화 요약하며 읽기

    많은 조직에서, 실험을 ‘revenue 지표 향상시키는 아이디어 찾아내기’ 내지는 ‘기획안 통과시키기 위한 근거찾기’ 정도로 여기곤 합니다. 그리고 그런 숫자들을 어떻게든 찾아내는 일을 데이터 분석이라고 부르려 하죠. 적어도 제가 리딩하는 팀에서 하고자 하는 실험과 분석은, 그런 것이 아닙니다.

    ... 더 보기

     • 

    저장 10 • 조회 1,430


    한시간 반만에 Cursor로 만든 개발서적 경매서비스 후기

    ... 더 보기

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

    jasonkang14.github.io

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

     • 

    저장 38 • 조회 3,825