[0725]모두에게 전하는 모두연 AI뉴스!

  • 대규모 언어 모델의 지식 메커니즘 분석: 활용과 진화를 통한 신뢰할 수 있는 AGI 개발

이 논문은 대규모 언어 모델(LLM)의 지식 메커니즘을 심층적으로 분석하며, 신뢰할 수 있는 AGI를 향한 발전에 필수적인 이해를 제공합니다. 지식 활용과 지식 진화라는 두 가지 새로운 분류체계를 통해 LLM 내의 지식 처리 방식을 탐구합니다. 지식 활용 부문에서는 암기, 이해와 적용, 창조의 다양한 메커니즘을 검토하고, 지식 진화는 LLM이 개인 및 그룹 차원에서 지식을 어떻게 역동적으로 발전시키는지에 초점을 맞춥니다. 또한, LLM이 학습한 지식의 취약성과 파라메트릭 지식에 대한 도전, 그리고 해결하기 어려운 잠재적 암묵지에 대해 논의합니다. 이 연구는 LLM의 지식 구조와 그 한계를 이해하는 데 중요한 인사이트를 제공하며, 향후 연구 방향에 대한 기초를 마련합니다.


https://huggingface.co/papers/2407.15017


  • Chain-of-Diagnosis: 의료 진단에서의 추론 투명성과 신뢰성을 향상시키는 새로운 접근 방식

의료 진단 분야는 대규모 언어 모델(LLM)의 등장으로 크게 발전했으나, 모델의 해석 가능성 문제는 여전히 주요 과제로 남아 있습니다. 이를 해결하기 위해, 연구에서는 진단 연쇄(Chain-of-Diagnosis, CoD)라는 새로운 접근 방식을 제안합니다. CoD는 의사의 사고 과정을 반영하는 진단 체인으로, 투명한 추론 경로를 제공하며 질병의 신뢰도 분포를 출력하여 의사 결정의 투명성을 보장합니다. 이러한 구조는 진단 과정에서 중요한 증상을 식별하고 신뢰도의 엔트로피를 감소시키는 데 도움을 줍니다. CoD를 기반으로 하는 DiagnosisGPT는 9604개의 질병을 진단할 수 있으며, 실험 결과에서는 기존 LLM보다 우수한 성능을 보였습니다. DiagnosisGPT는 진단의 엄격성과 해석 가능성을 동시에 제공하며, 이는 의료 진단 분야에서의 의사 결정 지원에 큰 도움이 됩니다.


https://huggingface.co/papers/2407.13301


AI 개발자 과정의 압도적인 수준 차이! 입문자에서 전공자까지! 아이펠 9기 모집중 : https://bit.ly/4ePP8iK

Paper page - Knowledge Mechanisms in Large Language Models: A Survey and Perspective

Huggingface

Paper page - Knowledge Mechanisms in Large Language Models: A Survey and Perspective

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 7월 25일 오전 7:37

댓글 0