백선환

AWS/ AIML Specialist

음성 챗봇이 텍스트보다 탈옥 시도에 더 취약

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔습니다.

✅ 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 것입니다.

🫨 특히, '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용하면, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하였으며, 성공률은 90%에 달했다고 합니다.

https://www.aitimes.com/news/articleView.html?idxno=159751

아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

AI타임스

더 많은 콘텐츠를 보고 싶다면?

이미 회원이신가요?

2024년 5월 20일 오전 5:16

저장 2 • 조회 908

함께 읽은 게시물

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

5일 전

“직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던가, 이 일이 날 성장시킨다던가, 이 일이 좋다던가, 이게 다 여기에 해당합니다.“ 박웅현 TBWA 코리아 조직문화연구소 소장은 직원들을 조직에 남게하는 방법을 이렇게 제안했다.

박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

뉴시스

저장 9 • 조회 1,193

장홍석

스페이스오디티 부대표/CPO

13시간 전

< 당신의 성장을 막는 가장 큰 적, '똑똑함' >

1. "최고의 경지에 오른 사람의 노하우나 디테일은 말로 설명하기가 어려워요. 어깨너머로만 배울 수 있어요. 그리고 그 작은 차이가 완성도를 판가름하죠.

댓글 1 • 저장 2 • 조회 255

장홍석

스페이스오디티 부대표/CPO

4일 전

< PM/PO 커리어 3단계: 당신은 How, What, Why 중 어디

1. PM/PO 커리어는 3개의 단계로 나눠 생각해 볼 수 있다. 그 세가지는 일을 할 때 거치는 3단계와도 같다. 일의 3단계는 무얼까.

댓글 1 • 저장 11 • 조회 998

SNEW 스타트업 뉴스

start-up and VC

하루 전

이 친구도 만만치않게 독특한 편

알렉산드르 왕, 두뇌 칩 상용화 전까지 출산 보류 선언…“초지능 아기 원해”

AI타임스

저장 1 • 조회 464

장홍석

스페이스오디티 부대표/CPO

하루 전

< 길을 잃기 위해 도서관에 갑니다 >

1. 이 세계에 존재하는 책의 99.99%를 저는 아직 읽은 적이 없습니다. 그 사실 앞에서 망연자실해집니다.

댓글 1 • 저장 2 • 조회 578

동크루트

AI 엔지니어, SW 엔지니어

5일 전

6월 초, 새로운 바이브 코딩과 SW 개발의 전환의 시대

바

2025년 2분기 AI 세미나

55check.imweb.me

저장 16 • 조회 2,312

비슷한 게시물

골빈해커 Chief Maker

OpenAI가 동영상 생성 모델인 Sora를 서비스로 오픈했습니다. 요즘 동영상 생성 서비스가 많이 나오고 또 성능이 매우 좋아져서 당장 아주 특별히 좋은가? 라는 느낌이 크게 오

문지현 Director of Global Strategy @Mirae Asset

Music generated by AI

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0219]모두에게 전하는 모두연 AI뉴스!

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0210]모두에게 전하는 모두연 AI뉴스!

백선환 AWS/ AIML Specialist

Bedrock, Luma AI Ray2 동영상 모델 출시!

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0117]모두에게 전하는 모두연 AI뉴스!

주간 인기 TOP 10

psmon 웹노리라이터

구현패턴으로 DB사용비용을 10배줄이기

K리그 프로그래머 커피한잔 개발자

1인 개발자의 최고의 사무실은 바로 자기집 방구석

한기용 UpZen 창업자 대표 & 산호세 주립대 교수

Airflow 3.0 주요 기능 소개

석민 커리어 코치

전략적 입사 지원

달레 Apollo GraphQL Software Engineer

🧊 급격하게 얼어붙고 있는 해외 취업 시장 🥶

김의중 프론트엔드 개발자

"마케팅을 바꾸는 데이터의 힘"을 읽고 정리해본 마케팅/데이터 개

조찬우 Coupang Sr. iOS Engineer

좋은 개발자는 환경이 만든다

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

엔지니어링의 핵심, 유지 보수가 가능한 파이프라인 구성하기

하조은 당근 Product Engineer

발이 닿지 않는 바다에서

장홍석 스페이스오디티 부대표/CPO

< AI의 '환각'보다 무서운, 내가 만드는 '환상' >

음성 챗봇이 텍스트보다 탈옥 시도에 더 취약

댓글 0

함께 읽은 게시물

< 당신의 성장을 막는 가장 큰 적, '똑똑함' >

< PM/PO 커리어 3단계: 당신은 How, What, Why 중 어디

< 길을 잃기 위해 도서관에 갑니다 >

6월 초, 새로운 바이브 코딩과 SW 개발의 전환의 시대

비슷한 게시물

주간 인기 TOP 10

추천 프로필