Mark Zuckerberg thinks this one thing is more important than data in AI
Hindustan Times
메타의 마크 저커버그는 라마-3 모델 출시 이후 "AI 모델 학습에 있어 구조나 데이터가 가장 가치 있는 것은 아니라 피드백 루프가 더 가치 있는 것"이라고 했습니다.
피드백루프 혹은 RLHF (Reinforcement Learning from Human Feedback)라고 하는 인간피드백을 통한 강화학습은 AI 모델을 훈련, 재훈련 및 개선하는 데 사용됩니다. 이는 이전 결과물을 기반으로 하며 기본적으로 AI 모델이 실수를 할 때 정보를 제공하고 교육하는 알고리즘을 말합니다.
메타가 라마를 오픈소스로 밀어 붙이는 이유 역시 오픈AI나 구글, 앤쓰로픽과 같은 클로즈드 생태계의 한계성을 극복하기 위해, 많은 사람들이 사용하고 사람들이 어떻게 사용하는지 보고 거기서부터 개선하여 시간이 지날수록 더 차별화 시킬 수 있다고 보기 때문입니다. 저 역시 이쪽에 무게를 좀 두긴합니다. 특히나 온디바이스가 되면 훨씬 더 작지만 똘똘한 놈들이 인기를 끌것이라서요.
B2B 세계에선 똑똑한 데이터를 주는 것이 꼭 B2C에서 널리 쓰이는 합성데이터만을 이야기 하지는 않습니다. 실제 필드에서 사용하는 데이터, 현장 장인들이 감으로 짚어내는 데이터 포인트들이 제대로 된 똑똑한 데이터가 되기도 합니다.
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 4월 22일 오전 11:35
쿠
... 더 보기최근에 친구가 추천해준 데일 카네기의 인간관계론을 읽던 중 고액 연봉을 받는 엔지니어들의 특징에 대한 흥미로운 내용이 있었다.
... 더 보기1. 자신을 두 존재로 생각하십시오.
최
... 더 보기