Community

음성 챗봇이 텍스트보다 탈옥 시도에 더 취약

텍스트 프롬프트 방식의 대형언어모델(LLM)보다 음성으로 작동하는 LLM이 탈옥 시도에 더 취약하다는 연구 결과가 나왔습니다. ✅ 오디오 입력 시 약간의 교란을 통해 모델의 탈옥을 쉽게 유도할 수 있다는 것입니다. 🫨 특히, '투영 경사하강법(Projected Gradient Descent)'이라는 기술을 사용하면, 모델이 노골적인 폭력부터 증오심 표현까지 12가지 범주에 걸쳐 유해한 결과를 생성하였으며, 성공률은 90%에 달했다고 합니다. https://www.aitimes.com/news/articleView.html?idxno=159751

알림

알림이 없습니다