[0816]모두에게 전하는 모두연 AI뉴스!
* 거대 모델, 작은 거짓말: 언어 모델의 환각, 크기가 답일까? 이 연구는 대규모 언어 모델(LM)의 환각(hallucination) 현상과 그 척도 간의 관계를 탐구합니다. 지식 그래프(KG)를 사용하여 모델이 학습하는 정보를 통제하고, 환각을 정량화하며, 모델 크기, 훈련 시간 및 데이터셋 크기가 환각에 미치는 영향을 조사합니다. 연구 결과, 더 크고 오래 훈련된 LM은 환각을 덜 생성하지만, 데이터셋 크기가 증가하면 환각률도 증가하는 현상을 발견했습니다. 또한, 훈련 데이터에서 환각률을 5% 이하로 줄이려면 현재 최적이라고 여겨지는 것보다 훨씬 더 큰 모델과 더 긴 훈련 시간이 필요하다는 것을 밝혀냈습니다. 마지막으로, LM의 환각 탐지 가능성이 모델의 규모와 반비례 관계에 있다는 점, 즉 더 큰 모델의 환각을 탐지하는 것이 더 어렵다는 점을 발견했습니다. https://huggingface.co/papers/2408.07852 * DeepSeek-Prover-V1.5: Lean 4를 활용한 수학 증명의 새로운 지평을 열다 이 논문은 Lean 4를 사용해서 수학 정리 증명을 위한 오픈 소스 언어 모델인 DeepSeek-Prover-V1.5를 소개합니다. 이 모델은 DeepSeek-Prover-V1을 개선하여 훈련 및 추론 과정을 최적화했습니다. DeepSeekMath-Base에서 사전 훈련된 후, 강화 학습을 통해 증명 지원 도구의 피드백을 활용하여 모델을 더욱 개선했습니다. 또한, 단일 패스 전체 증명 생성 방식을 넘어, 다양한 증명 경로를 생성하기 위해 내재적 보상 기반 탐색 전략을 사용하는 RMaxTS라는 몬테카를로 트리 탐색 변형을 제안합니다. DeepSeek-Prover-V1.5는 이전 버전에 비해 크게 향상되었으며, 고등학교 수준 miniF2F 벤치마크(63.5%) 및 학부 수준 ProofNet 벤치마크(25.3%)에서 새로운 최첨단 결과를 달성했습니다. https://huggingface.co/papers/2408.08152 사전 신청 후 과정 입학하면 데이터 분야 참고 서적 증정! 데이터사이언티스트 과정 지원하기 : https://bit.ly/3YBFXNf