Kimjeongeun

모두의연구소 아이펠캠퍼스 퍼실리테이터

[1015]모두에게 전하는 모두연 AI뉴스!

IMAGINE: AI의 상상력이 밝히는 상식 추론의 새로운 지평

이 논문은 텍스트 기반 상식 추론 모델의 일반화 능력을 향상시키기 위해 머신 상상력을 활용하는 새로운 제로샷 상식 추론 프레임워크인 IMAGINE을 제안합니다. IMAGINE은 텍스트 입력을 보완하기 위해 머신 생성 이미지에서 파생된 시각적 신호를 활용합니다. 이를 위해 사전 훈련된 언어 모델(PLM)에 이미지 생성기를 통합하여 머신 상상력을 부여합니다. 또한, 시각적 질문 답변을 시뮬레이션하는 합성 VQA 데이터 세트를 생성하여 PLM이 머신 상상력을 효과적으로 활용하도록 학습시킵니다. 다양한 추론 벤치마크에 대한 실험 결과는 IMAGINE이 기존 방법보다 성능이 뛰어나다는 것을 보여줍니다. 이는 머신 상상력이 보고 편향을 완화하고 일반화 능력을 향상시키는 데 효과적임을 시사합니다.

https://arxiv.org/abs/2410.09329

LLM, 다중 턴 공격에 취약! ActorAttack의 치명적인 공격 경로

이 논문은 대규모 언어 모델(LLM)의 다중 턴 대화에서의 안전 취약성을 노출하는 새로운 공격 방법인 ActorAttack을 제안합니다. ActorAttack은 악의적인 사용자가 여러 쿼리에 걸쳐 유해한 의도를 숨길 수 있는 상황을 공략합니다. 이 방법은 행위자-네트워크 이론에서 영감을 받아 의미적으로 연결된 행위자 네트워크를 공격 단서로 모델링하여 유해한 목표를 향한 다양하고 효과적인 공격 경로를 생성합니다. ActorAttack은 다중 턴 공격의 두 가지 주요 과제, 즉 유해한 의도를 숨기고 동일한 유해한 목표를 향한 다양한 공격 경로를 찾는 것을 해결합니다. 이를 위해 ActorAttack은 LLM의 지식을 활용하여 공격 단서를 자동으로 찾고, 공격 체인을 추론하여 단계별 공격 경로를 생성합니다. 실험 결과는 ActorAttack이 기존의 단일 턴 및 다중 턴 공격 방법보다 성능이 뛰어나며, 고급 정렬 LLM에서도 효과적임을 보여줍니다. 또한, ActorAttack에서 생성된 다중 턴 적대적 프롬프트와 안전 정렬 데이터를 포함하는 SafeMTData라는 데이터 세트를 공개합니다. 이 데이터 세트를 사용하여 안전 미세 조정된 모델은 다중 턴 공격에 더 강력합니다.

https://arxiv.org/abs/2410.10700

[마감임박!] AI개발자 과정! 입문자에서 전공자까지! AI학교 아이펠 10기 합류 : https://bit.ly/3Y0ZO7Q

Zero-shot Commonsense Reasoning over Machine Imagination

arXiv.org

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 10월 15일 오전 8:20

저장 1 • 조회 80

함께 읽은 게시물

이명진

한국레드햇 솔루션 아키텍트

2024년 04월 29일

상위 1% 파이썬 개발자가 사용하는 백엔드 레포지토리 TOP 8

상

🐍 8 backend repos used by the top 1% of python devs 🏆

Medium

저장 27 • 조회 2,178

유용우(요우)

NAVER 백엔드 개발자

5일 전

성장이 어려운 환경에서의 개발자 생활

저런 개발자 생활도 한적이 있어서 다양한 생각이 든다.

“어이 신입, 탈출각이다” | 요즘IT

요즘IT

저장 7 • 조회 1,021

변성윤

머신러닝 엔지니어, Engineering Manager

7월 2일

무신사의 대용량 트래픽 경험기

치

무진장 힘들었지만 무진장 성장한 개발 이야기

Medium

댓글 2 • 저장 32 • 조회 2,111

김챈스78

매일 책읽는 일러스트레이터.

하루 전

노력도 배신한다...250714

1.●관계를 결정하는건 그 사람의 태도이다.
2.●운이 안따른다고 생각이 들면 좀 기다려야 한다.

•

저장 2 • 조회 70

이양일

NaverCloud 백엔드 개발자

4일 전

품질 높은 프로젝트는 어떻게 만들어질까? 🤔

안

“품질 높은 프로젝트는 어떻게 만들어질까?”

F-Lab : 상위 1% 개발자들의 멘토링

저장 5 • 조회 1,154

Somewon Yoon

프로젝트 썸원 Content Owner

3월 27일

커리어를 쌓아야 할 때 알아야 하는 잔인한 사실들