[0905]모두에게 전하는 모두연 AI뉴스!

  • 테이블 증강 생성(TAG): 대규모 언어 모델과 데이터베이스 통합을 통한 자연어 쿼리 처리 혁신

테이블 증강 생성(TAG)은 데이터베이스를 통해 자연어 질문에 답하기 위한 통합된 범용 패러다임으로, 기존의 방법들이 충분히 탐색하지 못한 영역을 다룹니다. TAG는 대규모 언어 모델(LM)의 추론 및 지식 기능을 데이터베이스의 계산 능력과 결합하여, 사용자가 임의의 자연어 질문을 사용자 정의 데이터 소스에 대해 할 수 있도록 합니다. 기존의 Text2SQL 및 RAG 방법의 한계를 넘어, TAG는 LM과 데이터베이스 간의 광범위한 상호작용을 탐구하며 새로운 연구 기회를 제공합니다. 연구 결과, 표준 방법이 쿼리의 20% 이하만 처리할 수 있음을 발견하여 이 분야에 대한 추가 연구가 필요함을 강조합니다.


https://arxiv.org/abs/2408.14717


  • LongCite: 문장 수준 인용을 포함한 장문맥 LLM 성능 개선 및 LongCite-45k 데이터 세트

현재의 장문맥 대규모 언어 모델(LLM)은 광범위한 텍스트 기반 질문 응답에서 뛰어난 성능을 보이지만, 응답에 인용이 부족하여 검증이 어렵고 신뢰성 문제가 있습니다. 이를 해결하기 위해, 세분화된 문장 수준의 인용을 포함한 답변을 생성하는 새로운 접근 방식이 제안되었습니다. 자동화된 벤치마크인 LongBench-Cite를 통해 기존 LLM의 성능을 평가하고, 이를 개선하기 위한 CoF(Coarse to Fine) 파이프라인을 도입하여 LongCite-45k 데이터 세트를 구축했습니다. 이 데이터 세트를 바탕으로 LongCite-8B와 LongCite-9B 모델을 학습하여 정확한 응답과 문장 수준 인용을 동시에 생성할 수 있었습니다. 평가 결과, 이 모델들은 GPT-4o를 비롯한 고급 모델을 능가하는 인용 품질을 달성했습니다.


https://huggingface.co/papers/2409.02897


이론과 실무를 잇-다! 데이터로 비즈니스 가치를 만드는 데이터 사이언티스트 전문 과정 모집 중 : https://bit.ly/3YBFXNf

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 9월 5일 오전 6:01

댓글 0

    함께 읽은 게시물

    Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자로" 강의를

    ... 더 보기

    Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자"로

    www.productengineer.info

    Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자"로

     • 

    저장 8 • 조회 756


    어려운 문제를 대하는 태도

    

    ... 더 보기

    ✍️ 오늘은 PM이 읽어볼만한 책을 한 권 소개해드릴까 해요. 스스로의 동기부여가 어려운 분들이나, 동료를 설득해야되는 PM이나, 조직에 자발적 활력을 만들어내고 싶은 조직장 모두가 읽어볼만한 책입니다. — 📖 <스타트 위드 와이: 나는 왜 이 일을 하는가> 🔖 이성적 범주에 속하는 WHAT은 WHY에서 느껴지는 감정을 겉으로 보여주는 근거 역할을 한다. 어떤 직감으로 결정을 내렸는지 말로 표현할 수 있고 자신의 WHY를 명확히 설명할 수 있으면 주변 사람들에게 결정을 내린 이유를 분명히 이해시킬 수 있다. 이 결정이 객관적인 사실이나 수치와 일관성을 이룬다면 근거은 더욱 타당해진다. 이것이 바로 균형이다. (129p) — PM으로 일하면서 가장 어려운 일이 무엇이냐고 물어보면, 대부분 why를 조직장이나 동료들에게 설득하는 과정을 원탑으로 꼽을 겁니다. 문제를 정확히 정의하고, 논리를 만드는 것도 어렵고, 그것을 말이나 글로 표현해 내는 것도 어렵죠. 그래서 프로젝트 문서에 정량적인 데이터 분석을 수반하고, 숫자를 통해 프로젝트의 공감대를 형성하려고 시도할 때가 생깁니다. 하지만 Why에 대해 본인이 충... 더 보기

    실력 향상을 위한 해외 유튜브 채널 10개

    취업 준비와 코딩 공부할 때 도움 되는 해외 유튜브 채널 10개를 간략하게 소개합니다. 1. Gaurav Sen: https://www.youtube.com/@gkcs - 전반적인 개발자 성장(특히 주니어와 시니어), 취업, 코딩 공부 노하우 - 시스템 설계의 기초 개념 설명 영상이 많다. 특정 시스템 설계를 분석하거나 모의 면접하는 영상이 꽤 많지만 개인적으로 설명이 겉도는 느낌이 있다 - 주니어+/중니어+에게 특화된 취업 및 공부 노하우 2. Abdul Bari(컴공 전공, 알고리즘 공부 필수 채널): https:... 더 보기

    Gaurav Sen

    www.youtube.com

    Gaurav Sen

     • 

    저장 294 • 조회 8,674


    《Simple Truth》

    ... 더 보기

    결과보다 과정을

    

    ... 더 보기

     • 

    댓글 1 • 저장 4 • 조회 584