이병헌

프롬프트 엔지니어

<스페이스 하나의 차이>

오픈소스 vision language model인 moondream을 개발하고 있는 분이 트위터에 공유한 사례가 흥미로워서 가져왔습니다.

출처: https://twitter.com/felix_red_panda/status/1768058447747051688

모델의 학습과 추론 과정에서 쓰인 프롬프트에서 아래와 같이 마지막 공백을 지웠더니 성능이 유의미하게 향상되었다고 하네요.

"<image>\n\n{chat_history}Question: {question}\n\nAnswer: " ->

"<image>\n\n{chat_history}Question: {question}\n\nAnswer:"

다른 사람들의 설명을 읽어보니 다음과 같이 정리해볼 수 있을 것 같습니다.

1)토크나이저는 공백을 기준으로 토큰을 분류

2)그래서 토큰들은 공백으로 시작한다고 여기는 경우가 많음

3)예시와 같이 질문 프롬프트의 마지막에 공백이 포함된다면, 뒤에 오는 토큰은 공백을 포함하기 힘듬

4)따라서 맥락에 맞는 글을 생성하려면 익숙하지 않은 토큰을 사용해야 되기 때문에 답변의 품질이 저하됨

이 문제를 해결하기 위해서는 "Capital of France is<mask>." 대신 "Capital of France is <mask>."와 같이 학습시켜 토큰에 공백을 적게 포함시키는 방법이 있다고 합니다.

실제로 프롬프트 마지막에 공백에 차이를 두고 간단한 프롬프트를 여러 번 돌려봤더니, 답변의 수준은 모르겠지만 공백에 따라 log_prob값이 명확히 달라지는 걸 볼 수 있었습니다.

이런 걸 보니 Karpathy가 왜 "LLM의 모든 문제는 tokenization 때문에 발생한다"고 말했는지 이해가 되네요 ㅋㅋㅋ

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 3월 14일 오후 2:48

저장 1 • 조회 163

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

15시간 전

< 앵무새처럼 말하는 사람 vs 자석처럼 끌리는 사람 >

댓글 1 • 저장 1 • 조회 261

장홍석

스페이스오디티 부대표/CPO

2일 전

< 당신은 소비자인가, 생산자인가? >

댓글 1 • 저장 2 • 조회 455

강재상

스타트업 육성, Corprate Venturing, 사업, 커리어, 작가

4일 전

그래서 이유가 뭔데? 제목은 저렇게 해놓고 정작 이유가 없네. 최근 기사 중 가장 어그로 제목인 듯하다. 댓글창도 아예 막아놓은 걸 보니 의도한 것도 같고. 요즘 유튜브 콘텐츠도 이 정도로 거짓 제목까지는 잘 쓰진 않는다. 허무한 이유나 결론을 제시할 수는 있어도.

“계획된 적자? 아무나 못한다”…쿠팡은 성공 vs 티몬·발란은 고전한 이유 [일상톡톡 플러스]

세계일보

저장 1 • 조회 524

김재성

퍼블리 소프트웨어 엔지니어

2023년 07월 31일

리액트의 안정된 값에 대해 깊이 이해하기

쇼피파이 기술 블로그의 Mastering React’s Stable Values(https://shopify.engineering/master-reacts-stable-values)를 요약-번역한 글입니다. 저의 부연이 구별없이 섞여 있다는 것에 유의해주세요: --- "안정된 값"이란 여러 번의 렌더 동안 같은 값을 유지하는 값을 말합니다. 예를 들면 useState 에서 반환된 업데이트 함수, useRef에서 반환된 값, useCallback으로 감싸진 함수는 안정된 값이고, useMemo, useCallback ... 더 보기

Mastering React's Stable Values

Shopify

댓글 1 • 저장 3 • 조회 565

석민

커리어 코치

2일 전

스펙을 뛰어넘는 힘

저장 6 • 조회 649

석민

커리어 코치

17시간 전

사람과 데이터

저장 3 • 조회 390

비슷한 게시물

변성윤 머신러닝 엔지니어, Engineering Manager

Code with AI 발표 자료

박승규 카카오계열사에서 이것저것 만드는 개발자

MiniMind: 초소형 언어 모델을 밑바닥 부터 2시간만에 만들어보자!

골빈해커 Chief Maker

Claude 3.7 Thinking도, ChatGPT o3-mini-hight, o1 pro도, Gemini 2.0 Flash Thinking도 내 코드를 해결해주지 못하고 있다.

EasyDev Keep It Simple

Claude로 PC를 제어한다? - 앤트로픽 신규 업데이트

골빈해커 Chief Maker

Anthropic에서 Claude 등의 AI와 도구(다른 소프트웨어)들이 상호작용 할 수 있도록 만들어주는 프로토콜인 MCP를 발표했는데, OpenAI가 1년 전에 발표한 플러그인

박승규 카카오계열사에서 이것저것 만드는 개발자

미쳤다고 밖에 할 수 없는 AI에이전트들을 사용한 개발팀 꾸리기

주간 인기 TOP 10

K리그 프로그래머 커피한잔 개발자

진짜 1인 개발자 전성시대

황경찬(Boaz) P.E.C CEO

혹시 Claude 나 cursor 등 AI 로 개발하실 때 뭔가

골빈해커 Chief Maker

이력서 노션으로 절대 쓰지 마세요.

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

“무엇을 만들까”보다 “왜 해야 하나요?”를 묻는 사람들, 토스페

장홍석 스페이스오디티 부대표/CPO

< 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

달레 Apollo GraphQL Software Engineer

🍜 짜파게티가 왜 거기서 나와?

psmon 블룸에이아이 서버 엔지니어

액터모델을 이용 이벤트소스/클러스터상태관리를 우아하게하기 - 코틀

Arawn Park Senior Engineer & Engineering Lead

첫 회사보다 중요한 것

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

토스 데이터 직군 집중 채용 - 면접만 봐도 100만원!

우디디자인랩 대표ㅣ프로덕트 디자이너

면접에서 진심을 보여주는 마지막 질문

<스페이스 하나의 차이>

댓글 0

함께 읽은 게시물

< 앵무새처럼 말하는 사람 vs 자석처럼 끌리는 사람 >

< 당신은 소비자인가, 생산자인가? >

리액트의 안정된 값에 대해 깊이 이해하기

스펙을 뛰어넘는 힘

사람과 데이터

비슷한 게시물

주간 인기 TOP 10

추천 프로필