AI/ML 기반 모델 파인튜닝 및 서빙에 대한 가이드
Red Hat이 운영하는 하이브리드 클라우드 블로그(https://cloud.redhat.com/blog)에 "AI/ML 기반 모델 파인튜닝 및 서빙에 대한 가이드"라는 좋은 기사가 있어 공유합니다. [프롤로그] OpenAI의 ChatGPT 및 DALL-E와 같은 생성형(Generative) A에 대한 관심은 높아져 가고 있는데, 이러한 생성형 AI의 기반 모델을 구축하거나 학습하는 것은 쉬운 일이 아니죠. Google의 BERT 또는 Dolly와 같은 오픈 소스 기반 모델을 교육하는 데 많은 에너지와 리소스가 필요합니다. 기초 모델(Foundation model)의 초기 학습 단계에는 방대한 양의 일반 데이터가 필요하고 수만 개의 최신 GPU를 사용하고, 기술을 이해하는 머신러닝 엔지니어 및 데이터 사이언티스트들이 필요합니다. 기초 모델을 특정 도메인의 전문가처럼 사용하기 위해서 파인튜닝(fine-tuning), 프롬프트 튜닝(prompt tuning)과 같은 커스텀 기술을 적용해야 하는데요, 여기에는 종종 도메인 지식이나 고객별 데이터가 필요합니다. [기초 모델을 위해 Red Hat은 무엇을 할 수 있나요?] Red Hat은 실제 기반 모델을 생성하는 대신 이러한 모델의 학습, 프롬프트 튜닝, 파인튜닝 및 서비스를 가능하게 하는 환경을 포함하여 기본 기반 모델 워크로드 인프라를 서빙(serving)하는 데 초점을 맞춥니다. IBM이 최근에 차세대 AI 플랫폼인 IBM watsonx.ai가 쿠버네티스 기반 애플리케이션 플랫폼인 Red Hat OpenShift 기반 오픈 소스 기술 스택(stack)에서 어떻게 실행되는지 발표했습니다. 이 스택은 쿠버네티스에서 데이터 집약적인(intensive) 애플리케이션을 구축, 배포 및 관리하기 위한 오픈 소스 플랫폼인 ODH(Open Data Hub)에 구축되고 있습니다. Open Data Hub에서 완성된 기술은 Red Hat OpenShift AI, Red Hat의 AI 포커스 포트폴리오, 특히 엔터프라이즈 기술지원 솔루션인 Red Hat OpenShift Data Science에 반영됩니다. [왜 하이브리드 클라우드를 고려해야 하나요?] 법률 및 데이터 관련 이슈 모두에서 이러한 파인튜닝을 수행하기 위해 오픈 하이브리드 클라우드 AI 기반을 고려해야 하는 많은 이유가 있는데요. 데이터 과학자는 사전 훈련된(pretrained) 모델이 적합한 라이선스에 따라 사용 가능한지, 적합한 소스에서 학습되었는지 여부와 같은 법적 질문 또한 고려해야 합니다. 데이터가 직면한 과제(challenge)에는, 모델을 학습하는 데 사용하는 데이터와 관련해서, 예를 들어 규정 준수를 위한 정부의 제한이나 엄청난 양(sheer)의 데이터 볼륨 때문에 이 모델을 실행할 수 있는 위치가 제한될 수 있는지 등의 여부를 이해하는 것이 포함됩니다. 이러한 이유로 많은 조직에서는 파인튜닝 기반 모델 인프라에 대해 온사이트(온프레미스) 옵션을 고려하기를 원할 수 있습니다. Red Hat은 대규모 컴퓨팅 공간을 최적화하고 분산 워크로드 관리 및 오케스트레이션을 처리하기 위해 확장 가능한 환경(environment)을 구축하고 있습니다. 이러한 환경은 Red Hat OpenShift Data Science를 기반으로 하며 기초 모델을 더 잘 처리하도록 확장됩니다. 온프레미스 또는 모든 주요 퍼블릭 클라우드에서 실행할 수 있는 Red Hat OpenShift를 기반으로 구축된 Red Hat OpenShift Data Science는 데이터 과학자와 개발자에게 데이터에서 인사이트를 수집하고 지능형 애플리케이션을 구축할 수 있는 강력한 AI/ML 플랫폼을 제공합니다. 이는 AI/ML 실험(experiment) 및 모델의 전체 라이프사이클에 걸쳐 도구를 제공하는 AI 포커스 포트폴리오인 Red Hat OpenShift AI의 일부입니다. [IBM Research와 Red Hat이 공동으로 개발한 아키텍처] 대규모 모델 학습 및 파인튜닝을 위해 최근 오픈소스 Open Data Hub 커뮤니티에서 Project CodeFlare 인큐베이션을 시작했으며 이는 올해 후반에 Red Hat OpenShift Data Science에 도입될 예정이라고 합니다. CodeFlare 프로젝트는 일괄 처리 및 주문형 리소스 확장 기능을 갖춘 분산 교육 스택을 제공합니다. CodeFlare를 사용하면 고객은 수백 개의 분산된 AI/ML 워크로드를 쉽게 배포하고 관리하는 동시에 조직의 계산 비용을 최소화할 수 있습니다. CodeFlare는 CodeFlare SDK, MCAD(Multi-Cluster Application Dispatcher) 및 InstaScale의 세 가지 구성 요소로 구성됩니다. CodeFlare SDK는 사용하기 쉬운 인터페이스를 제공하며 Jupyter Notebook에서 쉽게 액세스할 수 있습니다. 기반 모델의 프롬프트 튜닝 및 인퍼런싱을 지원하기 위해 최근 Caikit을 도입했습니다. Caikit은 멀티태스킹 프롬프트 튜닝 및 텍스트 생성 인퍼런싱(TGIS)을 수행하기 위한 API를 제공합니다. 아키텍처의 또 다른 중요한 구성 요소는 모델 제공 프레임워크입니다. Open Data Hub 내의 서빙 엔진은 쿠버네티스에서 인기 있는 모델 추론 기술인 KServe 기술을 기반으로 하며 OpenShift Data Science에 모델 서빙 구성 요소로 포함되어 있습니다. [자세한 내용 확인하기] 실제 고객의 문제를 해결하기 위해 이 기술을 구축하는 방법에 대한 초기 사례는 하나는 IBM Watson Code Assistant를 사용한 Red Hat Ansible Lightspeed입니다. Ansible Lightspeed는 Ansible VSCode 확장을 통해 액세스하는 생성형 AI 서비스로, 사용자가 Ansible 플레이북을 생성하는 동안 코드 편집 환경에서 직접 권장 코드를 수락하고 실행할 수 있습니다. Red Hat은 업스트림 Open Data Hub 프로젝트와 엔터프라이즈 기술지원 제품인 Red Hat OpenShift Data Science 모두에서 HuggingFace와 같은 오픈 소스 커뮤니티 또는 상용 회사에서 구축한 다른 기초 모델을 위한 환경을 확장할 계획입니다. 하이브리드 클라우드에서 모델을 파인튜닝하고 제공하기 위한 기본 인프라를 제공하는 이 접근 방식은 오픈 소스 커뮤니티에서 발생하는 혁신을 활용하는 동시에 기본 모델과 표준 머신 러닝 모델 모두에서 작업할 수 있는 유연성을 제공합니다. 온사이트에서든 퍼블릭 클라우드에서든 일관되게 실행할 수 있는 OpenShift를 기반으로 하는 협업 환경을 생성하면 모델 라이프사이클 전반에 걸쳐 조직의 AI 이니셔티브를 가속화하고 확장하는 데 실제로 도움이 될 수 있습니다. Red Hat OpenShift Data Science에 대한 자세한 내용은 red.ht/datascience를 참조하세요. 관련 기사는 아래와 같습니다. 끝까지 읽어주셔서 감사합니다. 🍀🌈 [Source] https://cloud.redhat.com/blog/fine-tuning-and-serving-foundation-models [번역기사] https://raonsaeron.com/2023/06/ai-ml-foundation-model-fine-tuning-serving/