정영훈

네이버 Research Engineer

🤐 LLM 분야의 떠오르는 화두: Abstention (기권)

최근 LLM의 환각현상(Hallucination)을 줄이기 위한 대안으로 최근 떠오르는 방법론 중 하나는 "Abstention"입니다. 단어의 뜻은 "기권, 자제"인데요, 우리 말로는 "답변 포기"정도가 될 것 같습니다.

즉, LLM이 스스로가 불확실한 정보에 대해서는 답변을 거부할 수 있도록 하는 방법에 대한 연구인데요, 요즘 관련 연구가 많이 나오는 것 같습니다. 관심 있으신 분들은 시작하기 좋은 논문 3편을 아래에 소개해두었으니 간단하게 살펴보셔도 좋을 것 같습니다.

The Art of Refusal: A Survey of Abstention in Large Language Models

LLM의 답변 포기(Abstention) 방법에 대한 Survey Paper
아래 세가지 관점을 기준으로 기존 연구를 분석합니다.
- (1) The Query: 질문 자체의 모호성으로 답변 회피가 필요한 경우
- (2) The Model: 모델 지식의 부족으로 답변 회피가 필요한 경우
- (3) Human Values: 윤리적/사회적 가치 등의 이유로 답변 회피가 필요한 경우
https://arxiv.org/pdf/2407.18418

The Art of Saying No: Contextual Noncompliance in Language Models

답변하지 않아도 되는(Noncompliance) 질문 유형을 세분화하고 관련 데이터셋을 제공
"(1) The Query" 유형에 해당하는 방법론과 데이터를 소개합니다.
AllenAI, University of Washington, Microsoft Research 등 굵직한 기관들이 참여한 논문이네요.
https://www.arxiv.org/pdf/2407.12043

R-Tuning: Instructing Large Language Models to Say ‘I Don’t Know’

Instruction Tuning 단계에서 모델이 Parametric Knowledge 를 벗어나는 질문에 대해서는 답변하지 않도록 하기 위해 1) 무엇을 모르는 지를 파악하고 2) 모르는 것에 대해서는 답변하지 않도록 학습하는 방법 제시
"(2) The Model" 유형에 해당하는 방법론을 제시합니다.
최근 NAACL 2024에서 Outstanding Paper awards를 수상했어요.
https://aclanthology.org/2024.naacl-long.394/

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 8월 1일 오후 10:22

•

저장 41 • 조회 2,422

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

4일 전

< 서비스를 중독성 있게 만드는 결정적 원리 >

1. 진통제이면서 비타민이어야 한다.

댓글 1 • 저장 6 • 조회 968

달레

Apollo GraphQL Software Engineer

4일 전

🌎 해외에서 일하면 뭐가 좋을까요❓

외국어를 사용해서? 돈을 더 많이 벌어서? 새로운 기회가 많아서? 글로벌 경력을 쌓을 수 있어서?

댓글 1 • 저장 6 • 조회 2,728

장홍석

스페이스오디티 부대표/CPO

4월 27일

< 뛰어난 리더는 '시간'을 가장 까다롭게 쓴다 >

1. 관리자 업무 중 상당한 부분을 차지하는 일은 인력, 돈, 자본 등의 자원을 할당하는 것이다.

댓글 1 • 저장 4 • 조회 1,365

석민

커리어 코치

2023년 11월 18일

데이터 드리븐 리포트 (1)

책 [데이터 드리븐 리포트]를 읽고 757

저장 5 • 조회 1,107

골빈해커

Chief Maker

3일 전

IT 회사의 업무에서, 지금까지는 디자이너와 특히 개발자가 병목이었는데, 대 AI 시대에는 기획자가 병목이 될 수도 있겠다. 조금이라도 규모가 있는 기업에서의 가장 큰 병목은 보통 의사결정자라는 것을 생각해보면 그렇다.

즉, 실무보다 의사결정을 AI에게 맡기는 것이 병목을 해소할 수 있는 가장 확실한 방법이며, 그러므로 부장님과 사장님을 AI로 대체하는 것이야말로 인류의 번영을 위한 가장 빠른 지름길이다. (아님. 아니 맞나?!)

•

저장 1 • 조회 2,141

HoJoong Kim

Senior IT guy

2023년 03월 17일

기본적으로 알아야 할 머신러닝 알고리즘 10

머신러닝을 공부하면서 늘 헤깔리는 것중에 하나가 알고리즘 부문인 거 같습니다. 마침, 이 알고리즘을 깔끔하게 정리한 글이 있어 공유해 봅니다. 데이터 영역에 관심있는 분들 뿐만 아니라 머신러닝이나 AI에 관심있는 분들은 원문을 꼭 일독하시길 강추(!)합니다~^^ 📜 지도학습 👉 선형회귀, 로지스틱 회귀, K-최근접 이웃, 나이브 베이즈, 결정 트리, 랜덤 포레스트, XG부스트, 라이트GBM, 📜 비지도학습 👉 K-평균 군집화, 주성분 분석(PCA) 🔔 선형 회귀(Linear Regression) 🚩 문제 유... 더 보기

확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 | 요즘IT

요즘IT

•

저장 96 • 조회 3,662

비슷한 게시물

골빈해커 Chief Maker

📝 “환각”이 아니라 “헛소리”다

정영훈 네이버 Research Engineer

📝 LLM의 "모른다고 말할 용기"

장홍석 스페이스오디티 부대표/CPO

< 똑똑한 척하는 대신 제대로 생각하라 >

골빈해커 Chief Maker

📝 교육의 미래에 대한 논문

Annette MJ Kim 사람과 조직의 동반 성장을 위해 일해요:D

도움 행동에 대한 사회심리학 연구 중 ‘선한 사마리아인’ 연구로 널리 알려져 있는 연구가 있다. 프린스턴대 연구자 존 달리와 다니엘 뱃슨은 신학대 재학중인 예비 성직자를 대상으로

Annette MJ Kim 사람과 조직의 동반 성장을 위해 일해요:D

아무리 뛰어난 경영자라 해도 인간으로서 가지는 인지적 편향성을 피할 수는 없다. 따라서 조직의 명운을 좌우할 전략적 사안에 관한 결정을 어느 한 개인에게 의존할 수는 없다. 당연히

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

🤐 LLM 분야의 떠오르는 화두: Abstention (기권)

댓글 0

함께 읽은 게시물

< 서비스를 중독성 있게 만드는 결정적 원리 >

🌎 해외에서 일하면 뭐가 좋을까요❓

< 뛰어난 리더는 '시간'을 가장 까다롭게 쓴다 >

데이터 드리븐 리포트 (1)

기본적으로 알아야 할 머신러닝 알고리즘 10

비슷한 게시물

주간 인기 TOP 10

추천 프로필