초거대 AI의 거짓말을 멈추게 하는 법
생성형 AI의 약점이자 개선사항이라 볼 수 있는 할루시네이션(Hallucination) 현상과 데이터의 비실시간성을 극복할 수 있는 방법이 있을까 계속 궁금했었는데, 그에 대한 개선 아이디어를 제시한 짧지만 의미있는 글을 옮겨봅니다. ChatGPT의 개발사인 오픈AI는 ➡️ 할루시네이션 현상을 줄이기 위해 사람이 직접 좋은 데이터를 선별하고 초거대 AI의 답변을 평가하는 사람 피드백 기반의 강화학습(RLHF) 단계를 거듭 거쳐왔지만 문제를 완전히 해결하지는 못했습니다. ➡️ 두 번째로 비실시간성은 말 그대로 최신의 정보가 실시간으로 초거대 AI에 반영되지 못하는 현상입니다. AI가 학습하는 데이터의 크기가 워낙 크다 보니 슈퍼컴퓨터로도 수개월의 학습 기간이 필요하고, 이에 따라 최신 정보는 반영하지 못하는 한계가 있습니다. 이에 대한 해결 방안으로 네이버클라우드의 윤영진 AI 비즈니스 리더가 제안한 아이디어로 ➡️ 임베딩 API를 통한 해결 방안입니다. 임베딩 API란 기업 내부의 문서나 지식을 초거대 AI가 학습할 수 있는 형태로 변환하는 것을 의미하는데, 기업 내부의 문서나 지식을 초거대 AI가 이해할 수 있는 방식으로 DB화하고 초거대 AI가 해당 DB를 기반으로 답변하도록 함으로써 데이터의 신뢰도를 높이는 것입니다. ➡️그리고, 한번에 자동화하기보다는 AI를 적용했을 때 효율성이 큰 부분부터 충분한 안전장치를 두고 단계적으로 적용해 나가는 것을 추천하고 있습니다. 저도 이 부분에 동의하며, 요즘 많은 기업들이 초거대 생성형AI를 기업 내부에서 프라이빗하게 운영 및 활용하고자 하는 기획을 많이 하는 것으로 알고 있습니다. 실제 구체적인 사례들이 보다 많이 공유되길 기대해봅니다~ ^^ 출처: 디캠프뉴스레터