AI-Generated Text의 바다에서 살아남기

안녕하세요! 노토랩 변형호입니다.

대학교 예비 신입생들을 대상으로 AI 윤리에 대한 강의를 진행했습니다.
제가 강조하고 싶었던 내용은 미디어 리터러시였는데요.
앞으로 웹에 만연해질 가짜 정보와 여론 조성을 경계해야 한다는 주제였습니다.

구텐베르크가 15세기에 인쇄술을 발명했을 때도, 지식의 독점은 해소되었지만 거짓 정보 또한 확산되는 악영향을 미치기도 했습니다.
누구나 자신만의 고성능 인공지능을 활용하게 되는 지금의 시대에는, 인터넷 상의 정보는 더욱 더 왜곡되고, 유의미한 담론을 방해할 것입니다.

다행히도, 대한민국의 AI 기본법을 포함하여, 세계적으로 AI가 생성한 컨텐츠에 워터마크 표시를 의무화하는 정책이 논의되고 있습니다.
그런데, 이미지/비디오가 아닌 텍스트는 워터마크를 넣기 어려울 텐데, 어떻게 감지할 수 있을까요?

그래서, 오늘은 'AI가 생성한 텍스트를 탐지하는 방법'에 대해 연구한 최신 논문을 하나 소개드립니다.
(✅이모지의 과다한👓 사용📕으로 식별🔍하는 것보다는 전문적입니다😅😅😅)

논문은 ACL 2024에 게재된, "Threads of Subtlety: Detecting Machine-Generated Texts Through Discourse Motifs" 입니다!

논문에서는, 인간의 발화 패턴을 분석하는 수사 구조 이론(Rhetoric Structure Theory)를 이용해 텍스트를 변환합니다.
언어 분석에 그래프 이론을 적용한 것이 꽤 흥미로운데요.
하나만 미리 알려드리면, 인간은 주관적인 평가를 많이 언급하지만,
LLM 텍스트는 그런 부분이 매우 적은 편이었다고 합니다!

그동안의 포스트보다는 짧고 간단한 내용입니다.

LLM을 애용하신다면, 이런 부분에 맞춰 글을 비교하거나 수정해 보셔도 재미있는 경험이 되지 않을까 생각됩니다!

논문 요약은 댓글에 게시했습니다.
감사합니다 :)

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 3월 9일 오후 12:57

함께 읽은 게시물

고난이 사람을 키운다

태초에 모든 동물은 바다에서 살았다. 바다가 동물이 살기 좋은 환경이었던 것이다. 그런데, 동물 사이에 먹이 사슬이 형성되었고, 힘이 없는 동물들은 척박한 곳으로 밀려났다. 그곳이 바로 강이다. 처음에는 강에서 살기 힘들었지만, 성공적으로 적응하는 동물들이 생겨났고, 그래서 강에도 생태계가 형성되었다.

... 더 보기

제가 리드하고 있는 조직(당근마켓 커뮤니티실)에서 백엔드 엔지니어를 채용 중이에요.


커뮤니티실에는 동네 이웃들의 이야기와 정보를 공유하는 동네생활팀, 이웃 간의 취미와 관심사를 연결하는 모임팀, 그리고 아파트 단지 생활을 더 편리하고 즐겁게 만들어 줄 단지팀이 있어요. 지금 내 동네에서 일어나고 있는 일들을 더 쉽게 즐기고 공유할 방법들을 찾는 일이라면 무엇이든 도전하여 실행에 옮겨요. 만드는 사람이 불편할수록 쓰는 사람은 편하다는 믿음으로 도전적인 문제를 풀어나갈 분과 함께하고자 해요.

... 더 보기

조회 325