<구글 딥마인드,13배 빠르고 10배 저렴한 AI 훈련 방법 ‘제스트’>

커리어리 친구들, 구글 딥마인드가 13배 빠르고 10배 저렴한 AI 훈련 방법 ‘제스트’ 공개를 했습니다.


구글 딥마인드가 이미지 및 텍스트 처리를 위한 멀티모달 인공지능(AI) 모델의 성능을 높이고 비용을 줄이는 새로운 훈련 방법을 선보였다. 이를 통해 특정 작업에 대한 훈련 시간을 13배나 단축할 수 있었으며 필요한 컴퓨팅 성능은 10배나 적었다고 주장했습니다.


기존에는 훈련 데이터를 무작위로 선택하거나, 개별 관련성을 기반으로 선택하는 방식을 사용했습니다. 반면 제스트는 데이터를 개별적으로 선택하는 대신, 고품질 데이터를 포함하는 '배치(batch)' 선택법을 도입했습니다. 배치는 전체 훈련 데이터셋을 특정 크기로 나눈 데이터 단위를 뜻합니다.


이를 위해 제스트는 고품질 소스에서 사전 훈련한 소형 모델을 만들고, 이를 통해 전체 배치에 대한 데이터 품질을 평가하고 순위를 매깁니다. 즉 소형 제스트 모델을 통해 가장 적합한 배치를 선택, 멀티모달 AI 모델을 훈련하는 방식입니다.


연구진은 소규모의 고품질 데이터 세트로 사전 훈련한 제스트 모델을 만드는 과정이 가장 중요하다고 강조했고, 이 모델의 품질이 전체적인 성능을 결정한다고 합니다.


이처럼 신중하게 큐레이팅된 소규모 데이터셋으로 학습한 제스트 모델은 이후 더 큰 데이터를 필터링해 고품질의 데이터를 가려내게 됩니다.


딥마인드 연구진은 "작고 잘 큐레이팅된 데이터셋의 분포로 데이터 선택 과정을 유도하는 능력이 제스트 방법의 핵심”이라며 "이 방식은 최첨단 모델의 훈련 시간을 13배 단축하고 필요한 컴퓨팅 성능을 90%까지 줄일 수 있다"라고 주장했습니다.


https://www-aitimes-com.cdn.ampproject.org/c/s/www.aitimes.com/news/articleViewAmp.html?idxno=161363

구글 딥마인드, 13배 빠르고 10배 저렴한 AI 훈련 방법 '제스트' 공개

Ampproject

구글 딥마인드, 13배 빠르고 10배 저렴한 AI 훈련 방법 '제스트' 공개

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 7월 10일 오전 3:36

댓글 0

    함께 읽은 게시물

    🌎 해외에서 일하면 뭐가 좋을까요❓

    외국어를 사용해서? 돈을 더 많이 벌어서? 새로운 기회가 많아서? 글로벌 경력을 쌓을 수 있어서?

    ... 더 보기

    서버엔지니어의 시대적 고민

    ... 더 보기

    Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

    ... 더 보기

    쿠버네티스를 활용한 클라우드 네이티브 데브옵스 | 존 어런들 - 교보문고

    product.kyobobook.co.kr

    쿠버네티스를 활용한 클라우드 네이티브 데브옵스 | 존 어런들 - 교보문고

     • 

    저장 19 • 조회 1,697


    부족함에 대한 태도

    직장에서 다른 사람을 힘들게 하는 유형에도 여러 가지가 있는데, 그중 하나가 바로 완벽주의자다. 물론, 완벽을 추구하는 것이 나쁜 것은 아니다. 오히려 권장되기도 한다. 문제는 부족함을 대하는 태도에서 나온다. 완벽에 너무 집착한 나머지 부족함을 용납하지 못하는 정도가 되면 주변 사람들이 힘들어진다.

    ... 더 보기

    한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스로 공개

    ... 더 보기

    LinkedIn

    lnkd.in

    LinkedIn

     • 

    저장 19 • 조회 1,555


    비개발자도 Cursor AI로 결제 가능한 웹 서비스 만들기 🚀

    6

    ... 더 보기

    비개발자도 Cursor AI로 결제 가능한 웹 서비스 만들기 🚀 (6차. 25.06.21, 25.06.28) - Learning by Doing

    Latpeed

    비개발자도 Cursor AI로 결제 가능한 웹 서비스 만들기 🚀 (6차. 25.06.21, 25.06.28) - Learning by Doing