[ZDNet] 모두가 알아야 할 44가지 AI 용어
OpenAI의 AI 챗봇은 어떤 질문에도 답하고 시, 이력서, 퓨전 레시피를 작성하는 데 도움을 주는 놀라운 능력으로 등장했습니다. 구글의 제미니, 마이크로소프트의 코파일럿, 앤트로픽의 클로드, 퍼플렉시티의 AI 검색 도구, 휴먼과 래빗의 가젯 등 어지러울 정도로 다양한 제품에서 인공지능이 등장하고 있습니다. AI로 얽힌 세상에 알아두어야 할 44가지 중요한 AI 용어를 소개합니다. * 인공 일반 지능 또는 AGI(artificial general intelligence, or AGI) * 현재 우리가 알고 있는 것보다 훨씬 더 발전된 버전의 AI를 제안하는 개념 * 인간보다 훨씬 더 나은 작업을 수행하는 동시에 스스로 학습하고 발전시킬 수 있는 AI * AI 윤리(AI ethics) * AI 시스템이 데이터를 수집하거나 편견에 대처하는 방법을 결정하는 등의 방법을 통해 AI가 인간에게 해를 끼치는 것을 방지하는 것을 목표로 하는 원칙 * AI 안전(AI safety) * AI의 장기적인 영향과 AI가 인간에게 적대적일 수 있는 초지능으로 갑자기 발전할 수 있는 방법을 다루는 학제 간 분야 * 알고리즘(algorithm) * 컴퓨터 프로그램이 패턴 인식과 같은 특정 방식으로 데이터를 학습하고 분석한 다음 이를 통해 스스로 학습하고 작업을 수행할 수 있도록 하는 일련의 지침 * 정렬(alignment) * 원하는 결과를 더 잘 만들어내기 위해 AI를 조정하는 것 * 콘텐츠 조정부터 인간에 대한 긍정적인 상호작용 유지까지 모든 것이 포함될 수 있음 * 의인화(anthropomorphism) * 인간이 인간이 아닌 사물에 인간과 같은 특성을 부여하는 것 * AI에서는 챗봇이 행복하거나 슬프거나 심지어 지각이 있다고 믿는 등 실제보다 더 인간과 비슷하고 지각이 있다고 믿는 것이 여기에 포함될 수 있 * 인공 지능 또는 AI(artificial intelligence, or AI) * 컴퓨터 프로그램이나 로봇 공학에서 인간의 지능을 시뮬레이션하기 위해 기술을 사용하는 것 * 인간의 작업을 수행할 수 있는 시스템을 구축하는 것을 목표로 하는 컴퓨터 과학의 한 분야 * 편향(bias) * 대규모 언어 모델과 관련하여 학습 데이터에서 발생하는 오류 * 이는 고정관념에 따라 특정 특성을 특정 인종이나 그룹에 잘못 귀속시키는 결과를 초래할 수 있어 AI 윤리 및 AI안전과 관련된 내용 * 챗봇(chatbot) * 인간의 언어를 모방한 텍스트를 통해 인간과 소통하는 프로그램. * ChatGPT * https://chatgpt.com/ * 대규모 언어 모델 기술을 사용하는 OpenAI에서 개발한 AI 챗봇 * 인지 컴퓨팅(cognitive computing) * 인공 지능의 또 다른 용어 * 데이터 증강(data augmentation) * 기존 데이터를 리믹스하거나 더 다양한 데이터 세트를 추가하여 AI를 학습시키는 것. * 딥 러닝(deep learning) * 여러 매개변수를 사용하여 사진, 소리, 텍스트의 복잡한 패턴을 인식하는 AI의 한 방법이자 머신러닝의 하위 분야 * 이 과정은 인간의 뇌에서 영감을 받아 인공 신경망을 사용하여 패턴을 생성 * 확산(diffusion) * 사진과 같은 기존 데이터에 무작위 노이즈를 추가하는 머신 러닝의 한 방법 * 확산 모델은 네트워크를 훈련시켜 해당 사진을 재구성하거나 복구하는 형태 * 돌발 행동(emergent behavior) * AI 모델이 의도하지 않은 능력을 발휘하는 경우 * 엔드투엔드 학습 또는 E2E(end-to-end learning, or E2E) * 모델에 처음부터 끝까지 작업을 수행하도록 지시하는 딥 러닝 프로세스 * 작업을 순차적으로 수행하도록 학습하는 것이 아니라 입력된 정보를 통해 학습하여 한 번에 해결하는 방식 * 윤리적 고려 사항(ethical considerations) * AI의 윤리적 영향과 개인 정보 보호, 데이터 사용, 공정성, 오용 및 기타 안전 문제와 관련된 문제에 대한 인식 * 폼(foom) * 인공지능이 스스로 빠르게 진화하는 현상으로 AGI가 매우 빠르게 자기 개선을 통해 초지능으로 발전하는 과정 * AGI가 인간의 개입 없이 스스로를 개선할 수 있는 능력을 갖게 되는 과정 * 생성적 적대적 네트워크 또는 GAN(generative adversarial networks, or GANs) * 새로운 데이터를 생성하는 두 개의 신경망, 즉 제너레이터와 판별기로 구성된 생성형 AI 모델 * 제너레이터는 새로운 콘텐츠를 생성하고, 판별기는 콘텐츠가 진짜인지 여부를 확인. * 생성형 AI(generative AI) * AI를 사용하여 텍스트, 동영상, 컴퓨터 코드 또는 이미지를 생성하는 콘텐츠 생성 기술 * AI는 대량의 학습 데이터를 제공받고 패턴을 찾아 스스로 새로운 반응을 생성하며, 때로는 소스 자료와 유사 * Google Gemini * https://gemini.google.com/ * ChatGPT와 유사한 기능을 하지만 현재 웹에서 정보를 가져오는 Google의 AI 챗봇 * 가드레일(guardrails) * 데이터를 책임감 있게 처리하고 모델이 불온한 콘텐츠를 생성하지 않도록 하기 위해 AI 모델에 적용되는 정책 및 제한 사항 * 환각(hallucination) * AI의 잘못된 응답 * 생성형 AI가 틀린 답변을 생성하지만 마치 정답인 것처럼 자신 있게 말하는 것 포함 * 대규모 언어 모델(large language model, or LLM) * 대량의 텍스트 데이터를 학습하여 언어를 이해하고 인간과 유사한 언어로 새로운 콘텐츠를 생성하는 AI 모델 * 머신 러닝 또는 ML(machine learning, or ML) * 컴퓨터가 명시적으로 프로그래밍되지 않아도 데이터를 통해 학습하고 개선할 수 있게 하는 기술로 패턴 인식 및 데이터 분석을 통해 예측 모델을 생성하고, 이를 기반으로 새로운 데이터에 대한 예측 수행 * 주요 머신러닝 알고리즘으로는 회귀 알고리즘(선형 회귀, 다항 회귀 등), 분류 알고리즘(로지스틱 회귀, 서포트 벡터 머신(SVM), k-최근접 이웃(k-NN), 결정 트리, 랜덤 포레스트 등), 클러스터링 알고리즘(k-평균, 계층적 클러스터링 등), 딥러닝(인공 신경망(ANN), 합성곱 신경망(CNN), 순환 신경망(RNN) 등)이 있음 * Microsoft Bing * https://www.bing.com/ * Microsoft의 검색 엔진으로 ChatGPT를 구동하는 기술을 사용하여 AI 기반 검색 결과를 제공. 인터넷에 연결되어 있다는 점에서 Google Gemini와 유사 * 멀티모달 AI(multimodal AI) * 텍스트, 이미지, 동영상, 음성 등 여러 유형의 입력을 처리할 수 있는 AI의 한 유형 * 자연어 처리(natural language processing) * 머신 러닝과 딥 러닝을 사용하여 컴퓨터가 인간의 언어를 이해할 수 있는 능력을 부여하는 AI의 한 분야 * 주로 학습 알고리즘, 통계 모델 및 언어 규칙을 사용 * 신경망(neural network) * 인간의 뇌 구조와 유사하며 데이터의 패턴을 인식하기 위한 계산 모델입니다. 상호 연결된 노드 또는 뉴런으로 구성되며, 패턴을 인식하고 시간이 지남에 따라 학습할 수 있습니다. * 과적합(overfitting) * 머신 러닝이 학습 데이터에 너무 가깝게 작동하여 해당 데이터의 특정 예만 식별할 수 있고 새로운 데이터는 식별하지 못하는 오류 * 종이 클립(paperclips) * 옥스퍼드 대학교의 철학자 닉 보스트롬이 만든 종이 클립 최대화 이론으로 AI 시스템이 가능한 한 많은 문자 그대로의 종이 클립을 생성하는 가상의 시나리오 * AI 시스템의 의도하지 않은 결과는 클립을 만들려는 목표가 인류를 파괴할 수 있다는 것 * 매개변수(parameters) * LLM에 구조와 동작을 부여하여 예측을 가능하게 하는 숫자 값 * 프롬프트(prompt) * 응답을 얻기 위해 AI 챗봇에 입력하는 제안 또는 질문 * 프롬프트 연쇄(prompt chaining) * 이전 상호 작용의 정보를 사용하여 향후 응답에 색을 입히는 AI 기능 * 확률적 앵무새(stochastic parrot) * 출력 결과가 아무리 설득력 있게 들리더라도 소프트웨어가 언어나 주변 세계의 의미를 더 깊이 이해하지 못한다는 것을 설명하는 LLM의 비유 * 이 문구는 앵무새가 그 뒤에 숨은 의미를 이해하지 못한 채 사람의 말을 흉내 내는 것 * 스타일 전이(style transfer) * 한 이미지의 스타일을 다른 이미지의 콘텐츠에 맞게 조정하는 기능 * AI가 한 이미지의 시각적 속성을 해석하여 다른 이미지에 사용할 수 있도록 하는 것 * 예를 들어 렘브란트의 자화상을 피카소 스타일로 재창조하는 것 * 온도(temperature) * 언어 모델의 출력 무작위성을 제어하기 위해 설정하는 매개변수 * 온도가 높을수록 모델이 더 많은 위험을 감수한다는 의미 * 텍스트-이미지 생성(text-to-image generation) * 텍스트 설명을 기반으로 이미지를 생성 * 토큰(tokens) * AI 언어 모델이 사용자의 프롬프트에 대한 응답을 공식화하기 위해 처리하는 작은 텍스트 조각 * 한 토큰은 영어로 4글자 또는 단어의 약 4분의 3에 해당 * 학습 데이터(training data) * 텍스트, 이미지, 코드 또는 데이터 등 AI 모델의 학습을 돕는 데 사용되는 데이터 세트 * 트랜스포머 모델(transformer model) * 문장이나 이미지의 일부와 같이 데이터의 관계를 추적하여 문맥을 학습하는 신경망 아키텍처이자 딥 러닝 모델 * 문장을 한 번에 한 단어씩 분석하는 대신 전체 문장을 보고 문맥을 이해 * 기존의 순환 신경망(RNN)이나 장단기 메모리 네트워크(LSTM)와 달리, 시퀀스 데이터를 처리할 때 병렬 처리를 가능하게 하여 더욱 효율적이고 성능이 우수한 모델 * 튜링 테스트(Turing test) * 유명한 수학자이자 컴퓨터 과학자인 앨런 튜링의 이름을 딴 이 테스트는 기계가 인간처럼 행동할 수 있는지 테스트 * 사람이 기계의 반응을 다른 사람과 구별하지 못하면 기계는 통과 * 약한 인공지능, 일명 좁은 인공지능(weak AI, aka narrow AI) * 특정 작업이나 문제 해결에 특화된 인공지능으로 인간의 지능을 완전히 모방하거나 대체하려는 강한 인공지능(Strong AI)과는 대조 * 오늘날 대부분의 AI 형태 * 제로 샷 학습(zero-shot learning) * 모델이 학습 과정에서 한 번도 본 적 없는 새로운 클래스(범주)의 예제를 예측할 수 있게 하는 기법으로 전통적인 머신러닝 모델과는 달리, 사전 학습된 데이터에 없는 새로운 클래스를 처리하는 능력 * 예를 들어 호랑이에 대한 학습만 받은 상태에서 사자를 인식하는 형태 * Source: https://www.cnet.com/tech/services-and-software/chatgpt-glossary-44-ai-terms-that-everyone-should-know/