[1218]모두에게 전하는 모두연 AI뉴스!

DeepMind, LLM의 거짓말을 잡아내는 'FACTS' 개발!

DeepMind는 대규모 언어 모델(LLM)의 사실성을 평가하기 위한 새로운 벤치마크인 FACTS(Factuality-Aware Cross-Task Validation System)를 개발했습니다. LLM은 훈련 데이터에 포함된 정보를 학습하여 텍스트를 생성하지만, 생성된 텍스트가 사실인지 여부를 판단하는 것은 어렵습니다. FACTS는 LLM이 생성한 텍스트와 실제 사실 간의 일관성을 검증하여 이러한 한계를 극복하고자 합니다. FACTS는 다양한 출처에서 수집된 사실 정보를 기반으로 질문-답변 쌍을 생성하고, 이를 LLM에 질문하여 답변의 정확도를 평가합니다. 이를 통해 LLM의 사실성 평가 정확도를 높이고, 모델의 신뢰성을 향상시키는 데 기여할 것으로 기대됩니다. 또한 FACTS는 LLM 개발자가 모델의 약점을 파악하고 개선하는 데 도움이 되는 유용한 도구로 활용될 수 있습니다. 궁극적으로 FACTS는 LLM 기술 발전을 촉진하고, 사용자에게 더 신뢰할 수 있는 정보를 제공하는 데 기여할 것으로 기대됩니다.

https://deepmind.google/discover/blog/facts-grounding-a-new-benchmark-for-evaluating-the-factuality-of-large-language-models/

AI의 잊혀질 권리, '머신 언러닝'의 법적 딜레마

이 논문은 생성형 AI 모델의 머신 언러닝 기술과 관련된 법적, 정책적 함의를 분석합니다. 언러닝은 모델에서 특정 정보의 영향을 제거하거나 출력을 억제하는 기술입니다. 논문에서는 개인 정보 보호, 저작권, 안전 분야에서 언러닝 적용 시 발생할 수 있는 문제점과 과제를 다룹니다. 특히, 언러닝이 특정 데이터의 모델 학습 및 출력에 미치는 영향을 완전히 제거하지 못할 수 있으며, 법적 요구 사항을 충족하는 데 어려움이 있음을 지적합니다. 또한, 언러닝이 모델의 유용성을 저해하지 않으면서 원하는 결과를 달성할 수 있도록 신중한 접근 방식이 필요함을 강조합니다.

https://deepmind.google/research/publications/101479/

[아이펠 12기] 2024 마지막 개강
AI 입문부터 활용까지! 코어과정 & 논문으로 완성하는 리서치과정
https://bit.ly/40T8YFx
기술은 기본, 지표 중심 프로젝트를 완성하는 데이터 분석가 과정
https://bit.ly/4g1gvGk

FACTS Grounding: A new benchmark for evaluating the factuality of large language models

Google DeepMind

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 12월 18일 오전 5:55

비슷한 게시물

이양일 NaverCloud 백엔드 개발자

🤖 10분 만에 RAG 이해하기

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

DATA가 있어야 AI가 존재합니다.

골빈해커 Chief Maker

일리야 수츠케버가 사전학습 시대는 끝났고, 이제 사후학습 시대라고하는 이유는, 컴퓨팅 파워나 알고리즘은 계속 발전하지만 데이터에 한계가 있기 때문이라고 하는데요. 비유가 이마를 탁

골빈해커 Chief Maker

AI가 코드를 학습하고 생성하는 것에 대해 개발자들이 저작권 문제를 크게 개의치 않고 즐거워할 수 있는 이유는, 생성된 결과물이 완결성을 가지지 않기 때문이다.

골빈해커 Chief Maker

📝 Anthropic의 LLM 마인드 맵핑 개념 이해하기

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0318]모두에게 전하는 모두연 AI뉴스!

주간 인기 TOP 10

K리그 프로그래머 커피한잔 개발자

진짜 1인 개발자 전성시대

황경찬(Boaz) P.E.C CEO

혹시 Claude 나 cursor 등 AI 로 개발하실 때 뭔가

골빈해커 Chief Maker

이력서 노션으로 절대 쓰지 마세요.

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

“무엇을 만들까”보다 “왜 해야 하나요?”를 묻는 사람들, 토스페

장홍석 스페이스오디티 부대표/CPO

< 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

달레 Apollo GraphQL Software Engineer

🍜 짜파게티가 왜 거기서 나와?

psmon 블룸에이아이 서버 엔지니어

액터모델을 이용 이벤트소스/클러스터상태관리를 우아하게하기 - 코틀

Arawn Park Senior Engineer & Engineering Lead

첫 회사보다 중요한 것

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

토스 데이터 직군 집중 채용 - 면접만 봐도 100만원!

우디디자인랩 대표ㅣ프로덕트 디자이너

면접에서 진심을 보여주는 마지막 질문

[1218]모두에게 전하는 모두연 AI뉴스!

댓글 0

비슷한 게시물

주간 인기 TOP 10

추천 프로필