GPT-4o 페이퍼에서 가장 의외였던 부분

최근에 GPT-4o System Card 페이퍼를 읽었다. GPT-4o는 개인적으로 OpenAI에서 제대로 이갈고 만든 audio modality를 살린 모델이라는 느낌이 들었다.


아니나 다를까, 페이퍼에서도 새롭게 GPT-4 시리즈에 추가하게된 audio라는 modality가 가져올 수 있는 위험들을 분석하고 어떻게 해결하였는지에 대한 내용이 주를 이뤘다. 그래서 audio 쪽 ML 하시는 분들은 읽어보면 도움이 많이 될 것 같았다.


아무튼 내가 이 페이퍼를 읽으면서 가장 띠용? 싶었던 부분은 OpenAI의 Preparedness Framework와 관련이 있다. 이 Framework를 GPT-4o 페이퍼 읽으면서 처음 알게 되었는데 간단히 소개하자면, 계속해서 발전하는 frontier model에 맞춰서 업데이트가 되는 벤치마크라고 보면 된다. 단순히 한번 만들고 끝인 MMLU와 같은 벤치마크는 언젠가 LLM을 평가하기에는 너무 쉬운 벤치마크가 될 수 있다. LLM 성장 속도가 워낙 빠르기에.. 이런 기존 벤치마크의 한계점을 돌파하기 위해 Preparedness Framework를 OpenAI에서 만든 것 같다.


Preparedness Framework는 총 4가지 카테고리로 위험을 분석하는데, 그 중 2가지 카테고리가 내 눈을 사로잡았다. 바로, Cyber Security와 Model Autonomy다.


OpenAI에선 LLM이 Cyber Security를 너무 잘하는 것을 위험으로 판단하고 억제하려고 한다. LLM이 혼자서 0-day를 마구 찾아내는 재앙을 막기 위해서.. 이걸 보고 '아, LLM이 아무리 모든 걸 잘해도 Cyber Security는 인간이 계속 주도권을 쥐고 있어야 하는구나. 인간이 더 앞으로 집중해야할 분야는 LLM에서 맡겨서는 안될 Cyber Security와 Model Autonomy가 아닐까?!' 하는 생각이 들었다.


실제로 최근에 공개하고 있는 OpenAI의 모델들, GPT-4o, o1 의 경우에 Cyber Security 관련 실력이 좋아서 일부러 post-training으로 그 실력을 낮췄다고 페이퍼에서 얘기했었다.


LLM으로 대체되지 않을 분야는 바로.. Cyber Security..?


논문 링크: https://arxiv.org/abs/2410.21276

GPT-4o System Card

arXiv.org

GPT-4o System Card

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 11월 13일 오후 1:59

댓글 1

  • 0-day라니 sf소설 영화가 생각나서 헛웃음이 나오네요 일반인이 인공지능의 위험성에 대해 그런 걱정을 하는 건 기술에 대해 모르니까 그럴 수 있다쳐도 논문까지 읽은 분이 제로데이 언급하는 건 의외네요 제프리 힌턴도 인공지능의 위험성에 대해 경고하기는 하지만 딥페이크나 가짜뉴스 같은거지 핵전쟁 위험성은 아닌데 말입니다