[엔비디아] LLM 훈련을 위한 개방형 합성 데이터 생성 파이프라인 출시

AI계의 황제주인 엔비디아가 6월14일 대규모 언어 모델(LLM) 학습용 합성 데이터를 생성하는 데 사용할 수 있는 개방형 모델 제품군인 Nemotron-4 340B를 발표했습니다.


*참고로, 합성 데이터는 실제 데이터를 모방한, 인간이 생성하지 않은 데이터입니다. 생성형 인공 지능 기술을 기반으로 한 컴퓨팅 알고리즘 및 시뮬레이션을 통해 생성됩니다. 인위적일 수 있지만 합성 데이터는 수학적으로나 통계적으로 실제 데이터를 반영합니다. 연구에 따르면 합성 데이터는 실제 사물, 사건 또는 사람을 기반으로 한 데이터보다 AI 모델을 학습시키는 데 더 효과적이거나 더 우수할 수 있다고 합니다.*


  1. 네모트론-4 340B(Nemotron-4 340B)

  • 엔비디아 NeMo 및 엔비디아 텐서RT-LLM에 최적화된 모델 제품군

  • 최첨단 인스트럭트 및 보상 모델과 생성형 AI 훈련을 위한 데이터 세트 포함

  • LLM을 훈련하고 개선하는 데 사용되는 합성 데이터를 생성하는 파이프라인을 구성하는 기본, 인스트럭트, 보상 모델 포함

  • 데이터 큐레이션, 커스터마이징 및 평가를 포함한 엔드투엔드 모델 트레이닝을 위한 오픈 소스 프레임워크인 NVIDIA NeMo와 함께 작동하도록 최적화

  • 오픈 소스 NVIDIA TensorRT-LLM 라이브러리를 사용한 추론에도 최적화

  • 표준 애플리케이션 프로그래밍 인터페이스가 포함된 NVIDIA NIM 마이크로서비스로 패키지화되어 어디에서나 배포 가능

  • 허깅페이스: https://huggingface.co/collections/nvidia/nemotron-4-340b-666b7ebaf1b3867caf2f1911


  1. Nemotron을 탐색하여 합성 데이터 생성하기

  • Nemotron-4 340B Instruct 모델은 실제 데이터의 특성을 모방한 다양한 합성 데이터를 생성하여 데이터 품질을 개선함으로써 다양한 도메인에서 맞춤형 LLM의 성능과 견고성을 높일 수 있도록 지원

  • 개발자는 AI가 생성한 데이터의 품질을 높이기 위해 Nemotron-4 340B 보상 모델을 사용하여 고품질 응답을 필터링

  • 네모트론-4 340B 리워드는 유용성, 정확성, 일관성, 복잡성, 장황함의 다섯 가지 속성에 따라 응답의 등급 부여


  1. NeMo를 통한 미세 조정, TensorRT-LLM을 통한 추론 최적화

  • 개발자는 오픈 소스 NVIDIA NeMo 및 NVIDIA TensorRT-LLM을 사용하여 지시 및 보상 모델의 효율성을 최적화하여 합성 데이터를 생성하고 응답을 점수화

  • 모든 Nemotron-4 340B 모델은 개별 가중치 행렬을 여러 GPU와 서버에 분할하여 대규모로 효율적으로 추론할 수 있는 모델 병렬화의 일종인 텐서 병렬화를 활용하도록 TensorRT-LLM에 최적화

  • 9조 개의 토큰으로 훈련된 Nemotron-4 340B Base는 특정 사용 사례나 도메인에 맞게 NeMo 프레임워크를 사용하여 사용자 정의 기능

  • NeMo 프레임워크에서는 감독 미세 조정과 낮은 순위 적응 또는 LoRA와 같은 파라미터 효율적인 미세 조정 방법 등 다양한 커스터마이징 방법을 사용할 수 있습니다.

  • 모델 품질을 향상시키기 위해 개발자는 NeMo Aligner 및 Nemotron-4 340B Reward로 주석이 달린 데이터 세트를 사용하여 모델 정렬

    • 얼라인먼트는 인간의 피드백을 통한 강화 학습(RLHF)과 같은 알고리즘을 사용하여 모델의 동작을 미세 조정하여 안전하고 정확하며 상황에 적합하고 의도한 목표와 일치하는 결과물을 보장하는 LLM 훈련의 핵심 단계

  • 프로덕션 환경에 대한 엔터프라이즈급 지원과 보안을 원하는 기업은 생성형 AI 기초 모델을 위한 가속화된 효율적인 런타임을 제공하는 클라우드 네이티브 NVIDIA AI 엔터프라이즈 소프트웨어 플랫폼을 통해 NeMo 및 TensorRT-LLM에 액세스 가능


  1. 모델 보안 평가 및 시작하기

  • Nemotron-4 340B Instruct 모델은 적대적 테스트를 포함한 광범위한 안전성 평가를 거쳤으며, 광범위한 위험 지표에서 우수한 성능

  • 사용자는 합성적으로 생성된 데이터가 사용 사례에 적합하고 안전하며 정확한지 확인하기 위해 모델의 출력을 신중하게 평가

DeepL Translate: The world's most accurate translator

Deepl

DeepL Translate: The world's most accurate translator

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 6월 17일 오전 11:56

댓글 0

    함께 읽은 게시물

    📝무신사 글로벌 전략, 핵심만 쏙 정리했어요!

    ... 더 보기

    무신사 글로벌 전략, 핵심만 쏙 정리했어요

    www.openads.co.kr

    무신사 글로벌 전략, 핵심만 쏙 정리했어요

    혹시 Cursor 채팅만 사용하시나요? Agent 쓰는 방법!

    Cursor와 함께라면, 더이상 에디터는 단순한 입력 도구가 아닌

    ... 더 보기

    《Simple Truth》

    ... 더 보기

    국내 최초 ‘창고형 약국’이 성남에 문을 열며 약국 유통 구조에 변화를 일으키고 있습니다💊

    ... 더 보기

    구성원들이 의욕적으로 협력하고 열정과 에너지가 느껴지는 팀과 조직이 있는 반면, 서로의 일에 무관심하고 타성과 매너리즘에 빠져 무기력하게 하루를 보내는 조직이 있다. 이렇게 차이가 나는 이유는 뭘까? 그것은 근본적으로 팀과 조직을 이끌어가는 리더의 에너지 상태가 다르기 때문이다.

    ... 더 보기

    저성장기, 팀과 조직에 긍정에너지를 불어넣는 에너자이징 리더십이 요구된다 - 포브스코리아(Forbes Korea)

    포브스코리아(Forbes Korea)

    저성장기, 팀과 조직에 긍정에너지를 불어넣는 에너자이징 리더십이 요구된다 - 포브스코리아(Forbes Korea)

    퍼플렉시티는 세계 최대 검색 엔진 업체인 구글에 대항하는 AI 기반 검색 엔진으로 알려진 스타트업이다. 실시간으로 웹 기반 정보를 활용해 이용자 질문에 답변하는 AI 검색 서비스를 제공한다. 최근 기업가치 140억 달러로 투자 유치를 마쳐 인수가 성사된다면 애플 역대 최대 인수가 될 전망이다.

    ... 더 보기

    애플, AI 검색 스타트업 퍼플렉시티 인수 검토…“내부 논의 중”

    n.news.naver.com

    애플, AI 검색 스타트업 퍼플렉시티 인수 검토…“내부 논의 중”

     • 

    조회 226