생성 AI의 개념을 빅 빅쳐(Big Picture)로 이해하기

요즘 대세인 생성 AI를 쉽게 이해할 수 있도록 잘 정리된 기사 공유합니다😃. <초보자를 위한 생성 AI 소개> 1️⃣ 생성(generative) AI란 무엇이며 기존 AI와 어떻게 다른가요? - 생성 AI는 이미지, 텍스트, 코드 및 음악과 같은 새로운 데이터를 생성할 수 있는 알고리즘을 생성하는 AI의 하위 분야(subfield)입니다. - 생성 AI와 "기존 AI"의 가장 큰 차이점은 생성 AI는 학습 데이터를 기반으로 새로운 데이터를 생성한다는 것입니다. 또한 "기존 AI"는 할 수 없는 유형의 데이터와 함께 작동합니다. - '전통적 AI'는 차별적(discriminative) AI로 정의할 수 있는데, 실제로 보이지 않는 새로운 데이터에 대해 예측(predictions)이나 분류(classifications)를 할 수 있도록 기계 학습 모델을 학습합니다. 이러한 ML 모델은 숫자로만 작동할 수 있으며 때로는 텍스트(예: 자연어 처리의 경우)로도 작동할 수 있습니다. - 생성 AI에서는 ML 모델을 학습하고 학습된 데이터와 유사한 결과물(Output)을 생성합니다. 이러한 종류의 ML 모델은 숫자, 텍스트, 이미지, 오디오와 같은 다양한 종류의 데이터로 작동할 수 있습니다. - 기존 AI에서는 데이터로부터 학습하도록 ML 모델을 학습합니다. 그런 다음 신규 데이터와 보이지 않는(unseen) 데이터를 제공하여 식별하고 예측하거나 분류할 수 있습니다. - 이미지에서 개를 인식하도록 ML 모델을 학습한다고 가정 시, 학습된 ML 모델에 보이지 않는 신규 개 사진을 제공하면 이러한 신규 이미지가 개를 나타내는지 여부를 분류(딥러닝 알고리즘의 classification)할 수 있습니다. - 생성 AI의 경우 방대한 양의 데이터를 사용하여 다양한 소스의 데이터로 ML 모델을 학습합니다. 그리고 프롬프트(사용자가 입력한 자연어로 된 쿼리)를 입력하면 모델은 학습된 데이터와 유사한 결과물을 제공합니다. - 생성 AI로 개를 인식하도록 모델을 개발하였다고 한다면, 해당 모델은 개가 무엇인지 설명하는 엄청난 양의 (텍스트) 데이터에 대해 학습되었을 것입니다 - 사용자가 개가 무엇인지 모델에 쿼리하면 모델은 개가 무엇인지 자연어로 설명합니다. (ChatGPT가 떠오르시나요?🌈) 2️⃣ 대규모 언어 모델(LLM, Large Language Models) - 대표적인 생성 AI로 LLM이 있습니다. LLM은 많은 파라미터(수천만에서 수십억)를 갖는 인공 신경망(artificial neural network)으로 구성된 컴퓨터화된 언어 모델로, 자기 지도 학습(self-supervised learning) 또는 반 지도 학습(semi-supervised learning)을 사용하여 레이블이 지정되지 않은 대량의 텍스트에 대해 학습됩니다. - 대규모 언어 모델이라는 용어는 공식적인 정의가 없지만 대규모 코퍼스에서 "사전-학습된" 수백만 또는 수십억 개의 파라미터가 있는 딥 러닝 모델을 의미하는 경우가 많습니다. - LLM 활용 사례: 텍스트 분류(Text classification), 질문 및 답변(Question & Answering), 문서 요약(Document summarization), 텍스트 생성(Text generation) - 기존 AI(표준 ML 모델)와의 중요한 차이점은 다양한 작업들에 사용할 수 있는 DL 알고리즘을 학습할 수 있다는 것입니다. 이미지에서 개를 인식할 수 있는 시스템을 개발해야 한다면 분류 작업을 해결하기 위해 DL 알고리즘을 학습해야 합니다. 즉, 보이지 않는 새로운 이미지가 개를 나타내는지 여부를 알려주어야 합니다. 더 이상은 없습니다. 하지만 LLM 학습은 다양한 작업들에 사용이 가능합니다. (단, 페타바이트의 데이터 필요!) ❗️프롬프트 디자인과 프롬프트 엔지니어링의 차이 - 프롬프트 디자인(Prompt design): 시스템이 수행하는 특정 작업에 적합한 프롬프트를 만드는 기술. 예를 들어 LLM에게 텍스트를 영어에서 이탈리아어로 번역하도록 요청하려면 붙여넣는 텍스트를 이탈리아어로 번역하도록 모델에 요청하는 특정 프롬프트를 영어로 작성해야 함 - 프롬프트 디자인(Prompt engineering): LM의 성과를 향상시키기 위한 프롬프트를 만드는 프로세스. 도메인 지식을 사용하여 특정 키워드, 특정 컨텍스트 및 원하는 결과물과 같은 세부 정보를 프롬프트에 추가하는 것을 의미 ❗️LLM의 세 가지 유형 - 일반(Generic) 언어 모델: 학습 데이터의 언어를 기반으로 단어(또는 구)를 예측. (이메일 자동 완성 기능) - 지침 조정(Instruction Tuned) 모델: 입력에 제공된 지침에 대한 응답을 예측하도록 학습. (주어진 텍스트를 요약) - 대화 조정(Dialog Tuned) 모델: 후속 응답을 사용하여 사용자와 대화하도록 학습 (AI 기반 챗봇) - 실제로 배포되는 모델에는 혼합해서 사용. ChatGPT의 경우 텍스트를 요약하고 프롬프트에서 특정 주장에 대한 통찰력을 제공하고, 사용자와 대화하도록 학습됨: 지침 조정+대화 조정 3️⃣ 이미지 생성(Image generation): “DALL-E” 또는 “stable diffusion” ❗️이미지 생성의 범주 1) 변형 자동 인코더(VAEs, Variational Autoencoders): - 전체 구조의 일부로만 신경망을 필요로 하는 확률적 생성 모델 - 이미지를 압축된 크기로 인코딩하고 원래 크기로 디코딩하면서 데이터의 분포를 학습 2) 생성적 적대 모델(GANs, Generative Adversarial Models) - 두 개의 신경망이 서로 경쟁하며 하나의 이득이 다른 하나의 손실인 ML 프레임워크 클래스 - 하나의 신경망이 이미지를 생성하고 다른 신경망은 그것이 진짜인지 가짜인지 예측한다는 것을 의미 3) 자기회귀 모델(Autoregressive model): 이미지를 ramdom로 표현하기 위한 프로세스 일련의 픽셀로 처리하여 이미지를 생성 4) 확산 모델(Diffusion models): 이미지 생성 하위 분야에서 가장 유망하고 흥미로운 종류의 모델이라고 합니다. 😃 - Forward distribution process: 이미지의 구조가 "deployed"되는 초기의 반복적인 프로세스. 모든 픽셀이 순수한 노이즈가 되어 인간의 눈으로 이미지를 인식할 수 없게 될 때까지 이미지에 반복적으로 노이즈를 추가 - Reverse diffusion process: 데이터의 구조를 복원. 모델이 이미지를 재현하기 위해 픽셀을 "노이즈 제거"하는 방법을 학습하는 것과 유사 원본 기사 링크는 아래와 같습니다. 감사합니다🙏 [Source Link] https://towardsdatascience.com/a-gentle-introduction-to-generative-ai-for-beginners-8c8752085900

A Gentle Introduction To Generative AI For Beginners

Medium

A Gentle Introduction To Generative AI For Beginners

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 8월 29일 오전 10:03

댓글 0

    함께 읽은 게시물

    무조건 피하세요 I 면접 마지막 질문, 이렇게 답변하면 탈락 확률 UP

    ... 더 보기

    스뉴가 인스타그램 계정을 만들었습니다.

    ... 더 보기

    Instagram

    www.instagram.com

    Instagram

    젠슨 황은 어떻게 커리어를 쌓았나

    1. 젠슨 황은 항상 뛰어난 학생이었다. 하지만 다른 사람들과 사회적으로 상호작용하는 법을 배우기란 쉽지 않았다.

    ... 더 보기

    🔥IT 직군 취업과 커리어 성장을 위한 사이드 프로젝트 참여자 모집🔥

    ... 더 보기

    잘못된 판단으로 이직하면 커리어가 망가질 수 있습니다.

    ... 더 보기

    잡코리아가 2040 직장인을 대상으로 직장 내 추구미를 조사한 결과를 발표했다. 젊은 직장인들은 연봉 못지않게 도덕성, 공정성, 회사 운영방식과 가치관 등을 중요하게 생각했다.

    ... 더 보기

    2040 직장인의 추구미 "연봉보다 중요한 건..."

    톱클래스

    2040 직장인의 추구미 "연봉보다 중요한 건..."

    조회 244