[230907] 모두의연구소가 전하는 "모두를 위한 AI 뉴스"

🩵모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다. 그럼, 오늘의 AI 뉴스 시작해 볼게요! :) 1️⃣[RLAIF: 인간 피드백 없이 언어 모델 선호도 조절의 새로운 방법](https://huggingface.co/papers/2309.00267) 인간 피드백을 활용한 강화 학습(RLHF)은 대규모 언어 모델을 인간의 선호도에 맞게 조절하는 데 유용하지만, 인간의 선호도 레이블을 얻는 것이 어려운 문제입니다. 인간이 아닌 기존 언어 모델을 사용하여 선호도 레이블을 부여하는 RLAIF 방법과 RLHF 방법의 효과는 비슷하다는 것이 확인되었습니다. 인간 평가자는 약 70%의 경우에서 RLAIF와 RLHF 모델을 기본 모델보다 선호했습니다. 이 결과는 RLAIF가 인간 수준의 성능을 가지며, RLHF의 확장 문제에 대한 해결책이 될 수 있음을 보여줍니다. 2️⃣[FACET: 인구통계학적 속성에 따른 비전 모델 성능 평가를 위한 대규모 평가 세트](https://huggingface.co/papers/2309.00035) 컴퓨터 비전 모델은 성별, 피부색 등의 인구통계학적 속성에 따라 성능 차이를 보이는 것으로 알려져 있습니다. 이를 평가하기 위해 우리는 FACET라는 대규모 평가 세트를 제시하였습니다. 이 세트는 32k 이미지로 구성되어 있으며, 각 이미지에는 전문가에 의해 피부 톤, 머리 유형 등의 속성에 대한 주석이 달려 있습니다. FACET을 사용하여 최첨단 비전 모델을 평가한 결과, 모델의 성능은 인구통계학적 속성과 그 교차점에 따라 다르게 나타났습니다. 이는 모든 사람들이 비전 작업에서 동등하게 대우받지 못함을 의미합니다. 우리는 이 벤치마크를 통해 더 공정하고 효과적인 비전 모델 개발에 기여할 수 있기를 희망합니다. 3️⃣[YaRN: 트랜스포머 위치 임베딩의 일반화와 컨텍스트 확장 능력 향상](https://huggingface.co/papers/2309.00071) 트랜스포머 기반 언어 모델에서 효과적으로 위치 정보를 인코딩하는 회전식 위치 임베딩(RoPE)은 학습된 시퀀스 길이를 초과할 경우 일반화에 실패합니다. 이를 해결하기 위해 YaRN 방법이 소개되었으며, 이 방법은 이전 방법에 비해 10배 적은 토큰과 2.5배 적은 훈련 단계만 필요로 합니다. YaRN을 사용한 LLaMA 모델은 더 긴 컨텍스트 길이를 효과적으로 처리하고 외삽할 수 있으며, 이전 방법보다도 더 나은 컨텍스트 창 확장 능력을 보여줍니다. 📍AI학교 아이펠 7기 무료 입학하기! → https://bit.ly/3YDkLV4 #모두를위한AI뉴스 #AI뉴스 #AI트렌드 #모두의연구소 #아이펠

[230907] 모두의연구소가 전하는 "모두를 위한 AI 뉴스"

알림