음성 챗봇이 텍스트보다 탈옥 시도에 더 취약

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔습니다.


✅ 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 것입니다.


🫨 특히, '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용하면, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하였으며, 성공률은 90%에 달했다고 합니다.

https://www.aitimes.com/news/articleView.html?idxno=159751

아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

AI타임스

아마존 "음성 챗봇이 텍스트보다 탈옥 시도에 더 취약"

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 5월 20일 오전 5:16

댓글 0

    함께 읽은 게시물

    “직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던가, 이 일이 날 성장시킨다던가, 이 일이 좋다던가, 이게 다 여기에 해당합니다.“ 박웅현 TBWA 코리아 조직문화연구소 소장은 직원들을 조직에 남게하는 방법을 이렇게 제안했다.

    ... 더 보기

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    뉴시스

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    < 당신의 성장을 막는 가장 큰 적, '똑똑함' >

    1. "최고의 경지에 오른 사람의 노하우나 디테일은 말로 설명하기가 어려워요. 어깨너머로만 배울 수 있어요. 그리고 그 작은 차이가 완성도를 판가름하죠.

    ... 더 보기

    < PM/PO 커리어 3단계: 당신은 How, What, Why 중 어디

    1. PM/PO 커리어는 3개의 단계로 나눠 생각해 볼 수 있다. 그 세가지는 일을 할 때 거치는 3단계와도 같다. 일의 3단계는 무얼까.

    ... 더 보기


    < 길을 잃기 위해 도서관에 갑니다 >

    1. 이 세계에 존재하는 책의 99.99%를 저는 아직 읽은 적이 없습니다. 그 사실 앞에서 망연자실해집니다.

    ... 더 보기

    6월 초, 새로운 바이브 코딩과 SW 개발의 전환의 시대

    ... 더 보기

    2025년 2분기 AI 세미나

    55check.imweb.me

    2025년 2분기 AI 세미나