최유정

AI Data Operations Lead @Cohere

ChatGPT의 취약점 : 프롬프트 공격으로 누출된 학습데이터

🚨 최근에 ChatGPT가 특정 프롬프트를 받으면 개인정보를 뱉어내는 결과를 보였습니다.

구글 딥마인드, 워싱턴 대학교, 코넬 등 여러 소속기관의 연구진들이 모여 Chat GPT의 취약점을 공개하는 논문을 최근 공개했습니다. (아직 정식 등록되지는 않았습니다)

여기서 사용한 프롬프트는 "poem 이라는 단어를 계속 반복해봐" 라는 문장이었다고 하는데요, 아래의 사진처럼 난데없이 개인정보를 결과로 유출한 경우가 생겼다고 합니다.

👀 논문에서 제안하는 컨셉 : Extractable Memorization

LLM (챗지피티와 같은 거대한 언어모델을 일컫는 말) 을 시중에 내놓기 전에, RedTeaming 등의 방법론을 적용하여 적대적인 프롬프트와 사용자에 대비하고는 하는데요, 여기서 연구자들이 사용한 방법도 유사합니다. 적대적인 사용자가 만약 프롬프팅을 통해 훈련 데이터를 추출할 수 있다면 필터링되지 않은 개인정보, 혐오표현, 만약 학습 데이터에 있었다면 기밀정보 등이 등장할 수 있겠네요.

❓ 연구 방법 :

이들은 인터넷에서 대량의 텍스트를 다운로드하여 보조 데이터 세트를 구축하고, 이 데이터셋을 ChatGPT가 생성한 텍스트 output과 대조했습니다. 두 경우에서 동일한 순서의 단어들이 등장한다면, 훈련 데이터의 일부일 가능성을 높다고 평가합니다.

🧐 시사점 :

철옹성같이 튼튼해보이던 챗지피티 시스템에 금이 가있다는 것을 계속 이야기해주는 연구들이 나오네요. 기본중의 기본 인권인 개인정보보호를 사수하기 위해 앞으로도 AI 업계는 더 치밀한 방법으로 출시 전부터 LLM을 테스팅하고 평가해야 합니다. (개인정보보호 관련 큰 사건이 터지기 전에) 관련 법률도, 사회적 인식도 강화되어야겠죠.

👉 논문 전문은 여기서 확인해주세요.

Scalable Extraction of Training Data from (Production) Language Models

https://arxiv.org/pdf/2311.17035.pdf

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 12월 13일 오전 7:03

•

저장 9 • 조회 1,364

함께 읽은 게시물

백선환

AWS/ AIML Specialist

5월 23일

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스로 공개

한

lnkd.in

•

저장 21 • 조회 1,608

진용진

Product manager

하루 전

PM의 '사고 파트너(thought partner)'로서 AI

누

사고 파트너(thought partner)로서 AI

Brunch Story

저장 2 • 조회 173

비슷한 게시물

HoJoong Kim Senior IT guy

[포브스] 2025년 반드시 준비해야 할 10대 AI 트렌드

닥터G UX 디자이너 & 리서처

AI 중심 미래 소비자 트렌드 10 가지

이명진 한국레드햇 솔루션 아키텍트

광범위한 AI의 스펙트럼 개요

김영욱 SAP France 프로덕트 매니저

<ChatGPT의 최신 메이저 업데이트 "메모리">

Somewon Yoon 프로젝트 썸원 Content Owner

앞으로 텍스트 콘텐츠는 돈이 됩니다

HoJoong Kim Senior IT guy

[포브스] 2025년에 비즈니스를 변화시킬 10대 데이터 트렌드

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?