임지순

CEO, co-founder @ 3PM

AI, ML을 어깨 너머로만 공부하고 지켜보는 입장에서 BERT, GPT3와 같은 AGI(Artificial General Intelligence, 범용 인공지능) 모델이 실용적으로 어떤 의미가 있는지 궁금할 수 있다. 초거대 데이터셋을 갈아넣어서 수천억 개 파라미터를 가진 모델인 건 알겠는데, 그 거대한 모델을 우리 솔루션에 맞게 쓸 수는 없는 거잖아? 이를테면 AGI 모델을 우리 콜센터 전용으로 쓰고 싶다면, 초거대 데이터셋에 우리 데이터를 넣어서 다시 학습시켜야 되는 것 아닌가? 파라미터가 수천억 개라는데 우리가 그 학습 비용을 감당할 수 있을까? 사실, 잘 만들어진 모델을 각각의 엔터프라이즈 솔루션에 맞게 '튜닝'하는 방법론은 이미 존재한다. 이 분야에 관심이 있다면 들어봤을 전이 학습(Transfer Learning)이 그것. 사전에 학습된 모델은 수많은 레이어를 가진 복잡한 신경망으로 구성되어 있지만, 어쨌든 이 모델의 출력 계층은 정해져 있다. 전이 학습은 사전 학습된 모델의 출력 레이어를 '들어내' 버린다. 그리고 엔터프라이즈 솔루션에 맞는 새로운 데이터셋과 이를 학습하기 위한 새로운 레이어를 추가해서 학습시키는데, 이 과정에서 사전 학습된 모델의 출력 레이어 이전은 새로 학습시키지 않는다(즉, 고정된다. 이렇게 고정되는 신경망의 마지막 레이어를 병목Bottleneck 레이어라고 부름). 즉, '올라타고자' 하는 모델이 아무리 거대하더라도 이를 다시 학습시킬 필요 없이 그대로 사용하면 된다는 것. 비유하자면, 개/고양이/호랑이 등의 동물을 보고 분류할 줄 아는 아이에게 새로운 동물인 미어캣을 가르칠 때 모든 동물을 분류하는 법을 새로 가르칠 필요는 없다는 것. 아이의 뇌는 이미 일반적인 동물을 분류할 수 있는 신경망을 갖추고 있고, 여기에 미어캣 사진 데이터만 주고 학습시키면 된다.

텐서플로 허브와 전이학습 | TensorFlow Core

TensorFlow

다음 내용이 궁금하다면?

이미 회원이신가요?

2021년 1월 18일 오전 1:28

저장 4 • 조회 378

함께 읽은 게시물

SNEW 스뉴

start-up, VC and more

2일 전

업계는 오픈AI와 퍼플렉시티의 웹브라우저가 크롬의 아성을 무너뜨릴 수 있을지 주목한다. 시장조사업체 스탯카운터에 따르면 전 세계 웹브라우저 시장 점유율은 크롬이 68%로 압도적 1위다. 애플 사파리가 16%로 뒤를 이었고, 마이크로소프트 엣지 5%, 파이어폭스와 삼성인터넷은 2% 수준에 그쳤다. 크롬의 높은 검색 점유율은 구글의 광고 매출로 이어진다. 크롬은 사용자의 검색 기록을 바탕으로 광고를 타겟팅하고, 이를 통해 높은 수익을 올리고 있다.

‘크롬 천하’ 웹브라우저 시장 도전하는 AI기업들

국민일보

조회 303

SNEW 스뉴

start-up, VC and more

4일 전

💻

Instagram

www.instagram.com

저장 3 • 조회 425

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

하루 전

가끔 미국이나 홍콩 등에서 온 해외 투자자들을 만날 때가 있다. 이미 상장된 전 세계 대기업에 투자하는 큰 펀드를 운용하는 회사에 다니는 분들이다. 그들과 이야기하다가 한국의 경영자들은 그들을 잘 만나주지도 않고, 회사의 방향성에 대한 커뮤니케이션도 잘 못한다는 얘기를 들었다.

글로벌 매체에서 인정받는 한국 경영자가 없는 이유

ㅍㅍㅅㅅ

조회 182

장홍석

스페이스오디티 부대표/CPO

2일 전

< 좋은 관계를 위한 최소한의 예의, ‘거리 두기’ >

1. 살다보면 나를 끔찍이 싫어하는 사람이 한둘은 나오게 마련이다.

댓글 1 • 저장 1 • 조회 368

김소진

제니휴먼리소스 대표(헤드헌터/ 커리어코치)

하루 전

안정적인 기업 재미없어요! I 위기를 기회로 바꾸는 사람들

안

저장 1 • 조회 40

토마스 정

삼성 벤처스 아메리카 / Sr. Managing Director

2일 전

생각해볼 부분이 많은 chart

우리는 이런 세상에 살고 있고, 이중 몇몇은 더 잘될것이고, 몇몇은 말이되는 multiple로 내려올것.

저장 1 • 조회 159

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

야근의 관성

변성윤 머신러닝 엔지니어, Engineering Manager

무신사의 대용량 트래픽 경험기

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

기초 프로그래밍을 좀 더 열심히 공부할 걸..

진용진 Product manager

디자인 컴포넌트 기반 AI 프로토타이핑

황경찬(Boaz) P.E.C CEO

AI와 코딩할 때, 혹시 결과만 말하고 계신가요? 얼마 전 프로필

장홍석 스페이스오디티 부대표/CPO

< 인생을 바꾸는 ‘큰 돌멩이’의 법칙 >

이원형 라인플러스 소프트웨어 엔지니어

Gemini CLI가 무료라길래 주말에 사용해봤습니다. 기존에

psmon 웹노리라이터

DDD와 액터모델

골빈해커 Chief Maker

(웹)프론트엔드 개발이 쉬워보인다면 CSS나 WebGL 차력쇼나

레드버스백맨 리서처 앤 라이터

⟪트레바리 <리서치 하는데요> 6번째 시즌을 오픈합니다⟫

댓글 0

함께 읽은 게시물

< 좋은 관계를 위한 최소한의 예의, ‘거리 두기’ >

안정적인 기업 재미없어요! I 위기를 기회로 바꾸는 사람들

생각해볼 부분이 많은 chart

주간 인기 TOP 10

추천 프로필