HoJoong Kim

Senior IT guy

[AI Report] AI 위험 리포지토리의 분류 체계

지난 8월 14일, MIT 퓨처테크와 그 파트너들은 현재까지 수집된 가장 포괄적인 AI 위험 데이터베이스인 AI 위험 리포지토리를 공개했다. 이 데이터베이스의 목표는 AI로 인한 위험을 이해하고 해결하기 위한 공통의 참조 프레임을 만드는 것이다.

[ AI 위험 리포지토리(Risk Repository) ]

MIT 퓨처테크의 피터 슬래터리, 닐 톰슨, 알렉산더 사리, 에밀리 그룬디가 퀸즐랜드 대학의 마이클 노텔과 제스 그레이엄, 하모니 인텔리전스의 제임스 다오와 소루시 푸어, MIT CSAIL의 스티븐 캐스퍼, 미래생명연구소 및 KU 루벤의 리스토 우크와 협력하여 발표했다
The AI Risk Repository: https://airisk.mit.edu/

[ AI 리포지토리의 사용 방법 및 도메인 분류 체계 ]

7가지 위험 영역/도메인
- AI 시스템 안전, 장애 및 한계(76%)
- 사회경제적 및 환경적 피해(73%)
- 차별 및 독성(71%)
- 개인정보 보호 및 보안(68%)
- 악의적 행위자 및 오용(68%)
- 잘못된 정보(44%)
- 인간과 컴퓨터의 상호작용(41%)
23개 하위 도메인
- 부당한 차별 및 허위 진술(63%)
- 민감한 정보의 입수, 유출 또는 잘못된 추론으로 인한 프라이버시 침해(61%)
- 역량 또는 견고성 부족(59%)
- 사이버 공격, 무기 개발 또는 사용, 대량 피해(54%)
- 인간의 목표 또는 가치와 상충되는 자체 목표 추구(46%)
- 허위 정보, 감시, 대규모 영향력(41%)
- 허위 또는 오해의 소지가 있는 정보(39%)
- 권력 집중과 불공정한 이익 분배(37%)
- 독성 콘텐츠에 대한 노출(34%)
- 불평등 증가 및 고용의 질 저하(34%)
- 사기, 사기 및 표적 조작(34%)
- AI 시스템 보안 취약성 및 공격(32%)
- 인간의 노력에 대한 경제적, 문화적 평가 절하(32%)
- 거버넌스 실패(32%)
- 환경 피해(32%)
- 인간의 주체성 및 자율성 상실(27%)
- 투명성 또는 해석 가능성 부족(27%)
- 과잉 의존 및 안전하지 않은 사용(24%)
- 그룹 간 불균등한 성과(20%)
- 위험한 기능을 가진 AI(20%)
- 정보 생태계의 오염 및 합의 현실성 상실(12%)
- 경쟁적 역학 관계(12%)
- AI 복지 및 권리(2%)

[ 캐주얼 분류 ]

AI 위험 리포지토리는 식별된 위험을 도메인 범주에 따라 그룹화할 뿐만 아니라 '캐주얼 요인'에 따라 그룹화하기도 한다.
분류
- 위험의 원인이 AI인지 사람인지에 따라 '주체',
- 목표 추구로 인한 의도적 또는 비의도적 결과인지에 따라 '의도'
- 배포 전 또는 배포 후 발생하는 위험인지에 따라 '시기'

< 마커저커버그의 오픈 소스 AI가 앞으로 나아갈 길 >

의도하지 않은 피해와 의도적인 피해
- 의도하지 않은 피해
  - AI 시스템을 실행하는 사람이 의도하지 않았음에도 불구하고 AI 시스템이 피해를 입힐 수 있는 경우
  - 의도적인 피해
    - 악의적인 행위자가 해를 끼칠 목적으로 AI 모델을 사용하는 경우
    - 예) 딥페이크를 이용한 거짓정보 생성
해결 방법 = 오픈소스
- 시스템이 더 투명하고 광범위하게 조사할 수 있는 오픈소스 활용
- 모델 사용자가 철저한 보안 테스트를 수행하고 실수를 보고하고 수정할 수 있기 때문에 시스템 오류로 인한 의도하지 않은 피해에 대해 더 잘 보호

[ OpenAI vs Google ]

OpenAI
- 총 4개의 위험 식별: www.futuristiclawyer.com/p/openai-is-a-world-leader-in-ai-unsafety
- GPT-4o가 프레임워크의 4개 위험 범주 중 '사이버 보안', '생물학적 위협', '모델 자율성'의 3개 범주에서 낮은 평가
- 정치적으로 민감한 주제에 대한 설득력 있는 텍스트를 생성하는 모델의 능력으로 인해 네 번째 범주인 '설득'에서는 중간 점수를 받았다고 평가
Google
- AI 위험 분류와 관련하여 가장 많이 인용된 상위 20개 논문 중 5개가 모두 AI 위험 리포지토리에 리소스로 포함
- 구글 딥마인드는 최근 274페이지에 달하는 또 다른 보고서인 '고급 AI 비서의 윤리(2024)' 발표: Google's The Ethics of Advanced AI Assistants (2024): https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/ethics-of-advanced-ai-assistants/the-ethics-of-advanced-ai-assistants-2024-i.pdf

source: https://www.linkedin.com/pulse/what-actual-risks-ai-michael-spencer-exswc/

What are the Actual Risks of AI?

www.linkedin.com

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 8월 27일 오전 9:21

저장 1 • 조회 2,068

함께 읽은 게시물

SNEW 스타트업 뉴스

start-up and VC

하루 전

공식적으로 뭐하는 회사인지는 모르지만 일단 100억달러 기업가치

무라티의 싱킹 머신즈, 20억달러 투자 유치..."실리콘 밸리 사상 최대 시드 투자"

AI타임스

조회 384

SNEW 스타트업 뉴스

start-up and VC

2일 전

퍼플렉시티는 세계 최대 검색 엔진 업체인 구글에 대항하는 AI 기반 검색 엔진으로 알려진 스타트업이다. 실시간으로 웹 기반 정보를 활용해 이용자 질문에 답변하는 AI 검색 서비스를 제공한다. 최근 기업가치 140억 달러로 투자 유치를 마쳐 인수가 성사된다면 애플 역대 최대 인수가 될 전망이다.

애플, AI 검색 스타트업 퍼플렉시티 인수 검토…“내부 논의 중”

n.news.naver.com

•

조회 243

SNEW 스타트업 뉴스

start-up and VC

4일 전

국내 최초 ‘창고형 약국’이 성남에 문을 열며 약국 유통 구조에 변화를 일으키고 있습니다💊

댓글 1 • 저장 4 • 조회 519

황경찬(Boaz)

P.E.C CEO

2일 전

혹시 Cursor 채팅만 사용하시나요? Agent 쓰는 방법!

Cursor와 함께라면, 더이상 에디터는 단순한 입력 도구가 아닌

댓글 1 • 저장 7 • 조회 891

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

하루 전

지난 주 고등학교 동창 몇몇을 만났을 때였다. 그 중 둘의 얼굴이 매우 어두웠다. 공교롭게도 그 날 직원들이 퇴사하겠다며 사표를 냈다고 했다. 청천벽력인 것 같았다. 자신들의 관리 책임으로 돌아올까 봐 걱정하는 눈치였다.

[김인수 기자의 사람이니까 경영이다] 좋은 리더도 직원 이직률 낮추진 못해:행복한 퇴사자 만들라 - 매일경제

매일경제

저장 2 • 조회 358

기묘한

트렌드라이트 발행인

2일 전

📝무신사 글로벌 전략, 핵심만 쏙 정리했어요!

물

무신사 글로벌 전략, 핵심만 쏙 정리했어요

www.openads.co.kr

저장 2 • 조회 193

비슷한 게시물

HoJoong Kim Senior IT guy

AGI 2라운드,구글의 전략과 비장의 무기:제미나이(Gemini)2.0

HoJoong Kim Senior IT guy

[TechRepublic]2025년 주목해야 할 생성형 AI 트렌드5가지

HoJoong Kim Senior IT guy

[스탠퍼드 HAI] 2024 AI 인덱스 보고서

장혜림 (메이) 프리랜서 테크 비즈 라이터

개인, 회사, 정부가 AI 시스템을 사용하거나, 규제하는 법을 만들 때 고려해야 할 구체적인 리스크에는 무엇이 있을까요? 진짜 인프라에 문제가 생기는 건 당연히 전체 시스템을 마비

HoJoong Kim Senior IT guy

OpenAI, AI 기반 검색 엔진인 SearchGPT 발표

진용진 Product manager

AI가 이미 바꾸고 있는 세상

주간 인기 TOP 10

김의중 프론트엔드 개발자

이력서는 붙는데 면접에서 계속 떨어진다면?

동크루트 AI 엔지니어, SW 엔지니어

6월 초, 새로운 바이브 코딩과 SW 개발의 전환의 시대

골빈해커 Chief Maker

🪄 플레이모어와 함께할 동료를 찾습니다

장홍석 스페이스오디티 부대표/CPO

< PM/PO 커리어 3단계: 당신은 How, What, Why

Annette MJ Kim 사람과 조직의 동반 성장을 위해 일해요:D

“직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던

달레 Apollo GraphQL Software Engineer

Kotlin의 Scope 함수 정리

석민 커리어 코치

결과보다 과정을

기묘한 트렌드라이트 발행인

🔍네이버가 쿠팡 고객을 데려왔다고? 팩트 체크해 봤습니다

Somewon Yoon 프로젝트 썸원 Content Owner

젠슨 황은 어떻게 커리어를 쌓았나

이재호 책 <일 잘하는 팀장> 저자. 네오위즈 AI 개발자

고난이 사람을 키운다

[AI Report] AI 위험 리포지토리의 분류 체계

댓글 0

함께 읽은 게시물

혹시 Cursor 채팅만 사용하시나요? Agent 쓰는 방법!

📝무신사 글로벌 전략, 핵심만 쏙 정리했어요!

비슷한 게시물

주간 인기 TOP 10

추천 프로필