이병헌

프롬프트 엔지니어

LLM의 저작권 침해, 합리적으로 접근해야

출처: https://www.patronus.ai/blog/introducing-copyright-catcher

최근 한 스타트업에서 LLM의 답변 중 저작권을 침해하는 내용이 얼마나 자주 등장하는지 조사한 결과를 발표했습니다.

이들은 '특정 창작물의 첫 문단 작성'과 '발췌문 이어쓰기'라는 두 가지 프롬프트를 사용해 실험했는데요. 그 결과 gpt4는 26%/60%, claude2.1는 0%/16%, mixtral-8x7B는 38%/6%, llama2-70B는 10%/10%의 경우 원문을 그대로 답했다고 합니다.

LLM의 학습 과정에 개인정보나 저작물이 포함되어 있다면, 생성 단계에서도 원문이 노출될 가능성이 있습니다. 하지만 이를 문제 삼으려면 좀 더 신중할 필요가 있어 보입니다.

일반적인 대화 맥락과 무관하게 개인정보나 저작물을 그대로 답하거나, 출처를 밝히지 않고 마치 AI가 창작한 것처럼 답변한다면 문제가 될 수 있겠죠. 하지만 위 실험은 LLM에게 저작권 침해를 유도한 뒤 문제를 제기하는 방식입니다.

검색 엔진을 통해서도 저작권이 있는 콘텐츠 원문에 접근할 수 있듯이, LLM도 프롬프트에 따라 유사한 결과를 보일 수밖에 없습니다. 중요한 건 일상적인 대화 상황에서 저작권 침해가 얼마나 발생하는지를 살피는 거겠죠.

물론 LLM에 적절한 가드레일을 적용하는 것도 필요합니다. 하지만 그에 앞서 이 기술을 어떻게 활용할 것인지, 어떤 문제에 주목해야 할지 숙고해 봐야 할 것 같네요.

Patronus AI | Introducing CopyrightCatcher, the first Copyright Detection API for LLMs

Patronus

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 3월 16일 오전 8:08

함께 읽은 게시물

SNEW 스타트업 뉴스

start-up and VC

2일 전

아기유니콘 사업을 주관한 중기부는 F사가 성인 콘텐츠 사업을 영위하고 있는 것에 대해 충분히 인지하지 못했다는 입장이다. 중기부 관계자는 “해당 F사의 사업 계획서 내용과 조금 다른 부분이 있었던 것 같다”면서 “아직 협약 체결을 하지 않은 상태이기 때문에, 관련 사안을 더욱 면밀히 파악하고 최종 협약 여부를 결정하겠다"라고 말했다.

성인콘텐츠도 많은데…중기부 '아기유니콘' 선정 논란

서울경제

저장 1 • 조회 207

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

2일 전

A 회사가 구설에 올랐다. 직장인 익명 커뮤니티에 올라온 글에 따르면 내부 분위기가 매우 좋지 않다고 한다. 과거 A사는 사업을 다양하게 벌인 것에 비해, 돈은 별로 벌지 못했다고 한다. 이때 경영진은 고통을 다 같이 나누자며 모든 직원의 연봉 인상을 제한하고 성과급도 소액만 주었다.

나쁜 회사를 구별하는 매우 효과적인 방법,나쁜 회사를 구별하는 매우 효과적인 방법

체인지그라운드,체인지그라운드

저장 1 • 조회 517

장홍석

스페이스오디티 부대표/CPO

2일 전

< 똑똑한 사람은 복잡하게 말하지 않는다 >

1. 누군가가 화려한 단어나 두루뭉술한 개념을 많이 사용한다면 아마 자신이 무슨 말을 하는지도 모를 것이다.

댓글 1 • 저장 1 • 조회 434

SNEW 스타트업 뉴스

start-up and VC

5일 전

지비지오는 지난해 5월 서비스 출시 후 월평균 거래액이 45%씩 성장했다. 지난 3월 100억원의 시리즈A 투자도 유치했다. 데이터 기반으로 경쟁력을 키운 게 주효했다. 일례로 인스타그램에서 댓글을 달면 DM으로 구매 링크를 자동 발송하는 기능을 자체 개발해 무료로 배포했다. 다이렉트 메시지(DM)을 활용하는 인플루언서의 실적이 더 높다는 데이터를 확인했기 때문이다.

팔로워 1천명이 5억 매출…VC도 놀란 인플루언서 '찐템 마켓' - 머니투데이

머니투데이

저장 1 • 조회 353

기묘한

트렌드라이트 발행인

2일 전

🥕첫 '권고사직'에 나선 당근, 정말 위기인 걸까요?

누

첫 '권고사직' 당근, 정말 위기일까요?

www.openads.co.kr

저장 1 • 조회 195

장홍석

스페이스오디티 부대표/CPO

6일 전

< 서비스를 중독성 있게 만드는 결정적 원리 >

1. 진통제이면서 비타민이어야 한다.

댓글 1 • 저장 8 • 조회 1,089

비슷한 게시물

골빈해커 Chief Maker

AI가 코드를 학습하고 생성하는 것에 대해 개발자들이 저작권 문제를 크게 개의치 않고 즐거워할 수 있는 이유는, 생성된 결과물이 완결성을 가지지 않기 때문이다.

골빈해커 Chief Maker

아마도 곧 생성AI 업계가 재편될 것. 대기업은 각자의 카테고리를 명확하게 할 것이며, AI만을 표방한 스타트업은 망할 곳이 빠르게 망하고, 이제 진짜 가치 있는 새로운 주제 혹은

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

보통 기업의 AI 전략 - 데이터, 데이터, 데이터

이지영 부스트캠프 웹・모바일 담당

💻 인공지능과 개발자: 안광섭(해봄)님 #AI동향 #개발자의자세

서지연 개발자

자가 치유 코드를 사용하여 기술 부채를 줄이는 방법

골빈해커 Chief Maker

구글 딥마인드의 gemma-2 2B 모델이 2B 모델 주제에(?) ChatGPT-3.5와 Llama-2 70B을 뛰어 넘어서 화제다. (Chatbot Arena ELO Score

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

LLM의 저작권 침해, 합리적으로 접근해야

댓글 0

함께 읽은 게시물

< 똑똑한 사람은 복잡하게 말하지 않는다 >

🥕첫 '권고사직'에 나선 당근, 정말 위기인 걸까요?

< 서비스를 중독성 있게 만드는 결정적 원리 >

비슷한 게시물

주간 인기 TOP 10

추천 프로필