HoJoong Kim

Senior IT guy

[AI] 다음 단계의 CoT 프롬프팅

CoT(Chain-of-Thought) 기법은 사용자의 프롬프트에 대해 AI가 단순히 최종 답변을 제시하는 것이 아니라, 중간 단계의 사고 과정을 보여주는 것을 목표로 합니다. 이를 통해 AI의 추론 과정을 투명하게 만들고, 사용자가 AI의 답변을 더욱 신뢰할 수 있게 합니다.

1. 전략적 CoT(Strategic Chain-of-Thought): 전략 도출을 통해 LLM에서 정확한 추론 유도하기

-- Paper: https://arxiv.org/abs/2409.03271v1

어떤 문제를 해결하나요?
- 생각의 연쇄(CoT) 프롬프트는 대규모 언어 모델(LLM)에서 다단계 추론 능력을 이끌어내는 데 널리 사용되는 기법이 되었습니다.
- CoT는 중간 추론 단계를 제공함으로써 LLM이 복잡한 문제를 보다 효과적으로 해결할 수 있게 해줍니다. 그러나 생성된 추론 경로의 품질과 일관성이 불안정하여 추론 작업에서 최적의 성능을 발휘하지 못할 수 있습니다.
이 문제를 어떻게 해결하나요?
- 전략적 사고 연쇄(SCoT)는 전략적 지식을 CoT 프로세스에 통합하여 불안정성 문제를 해결합니다.
- SCoT는 중간 추론 단계를 생성하기 전에 전략적 지식을 통합함으로써 보다 일관되고 신뢰할 수 있는 추론 성능을 보장합니다.
- SCoT는 단일 프롬프트 내에서 2단계 접근 방식을 사용합니다.
  - 먼저, LLM에서 효과적인 문제 해결 전략을 도출합니다.
  - 그런 다음, 이 전략을 사용하여 고품질의 CoT 경로와 최종 답변을 생성하도록 안내합니다.
다음 단계는 무엇인가요?
- LLM이 더 복잡한 작업에 계속 사용됨에 따라 전략적 지식을 통합하고 추론 경로의 일관성을 개선하는 것이 중요해질 것입니다. SCoT는 이러한 방향의 향후 연구를 위한 유망한 프레임워크를 제공합니다.

2. OLMoE(Open Mixture-of-Experts Language Models): 개방형 전문가 혼합 언어 모델

-- Paper: https://arxiv.org/abs/2409.02060

-- Code: https://github.com/allenai/OLMoE

어떤 문제를 해결하나요?
- 전문가 혼합(MoE)은 보다 효율적이고 확장 가능한 언어 모델을 구축하기 위한 유망한 접근 방식입니다.
- 전문화된 '전문가' 모델 세트와 게이트 메커니즘을 사용하여 입력을 가장 관련성이 높은 전문가에게 라우팅함으로써 MoE는 밀집 모델에 비해 더 적은 매개변수로 더 나은 성능을 달성할 수 있습니다.
- 그러나 MoE 아키텍처에 대한 지속적인 연구와 개선에도 불구하고 Llama와 같은 대부분의 최신 언어 모델은 여전히 밀도 아키텍처에 의존하고 있습니다.
이 문제를 어떻게 해결하나요?
- 최초의 완전 오픈 소스, 최첨단 믹스 오브 엑스퍼트 언어 모델인 OLMOE-1B-7B가 소개되었습니다.
- 1B개의 활성 파라미터와 7B개의 총 파라미터를 갖춘 OLMOE-1B-7B는 DeepSeekMoE-16B 및 Llama2-13B-Chat과 같은 대규모 고밀도 모델보다 뛰어난 성능을 발휘합니다.
다음 단계는 무엇인가요?
- OLMOE-1B-7B의 완전한 오픈 소스 릴리스는 최첨단 MoE 모델에 대한 접근성을 높이고 이 분야에 대한 추가 연구를 장려하기 위한 중요한 단계입니다.
- 이 분야에서 MoE의 잠재력을 계속 탐구함에 따라, 프론티어 모델과 완전 개방형 모델 간의 성능 격차를 줄이기 위한 OLMOE 및 기타 오픈 소스 MoE 모델의 새로운 반복을 볼 수 있을 것으로 예상됩니다.

3. Yi-Coder: 작지만 강력한 코드용 LLM

-- Code: https://github.com/01-ai/Yi-Coder

어떤 문제를 해결하나요?
- Yi-Coder는 100억 개 미만의 파라미터로 최첨단 코딩 성능을 제공하는 일련의 오픈 소스 코드 LLM입니다.
- 긴 컨텍스트 모델링을 처리하고 코드 생성, 편집, 완성, 수학적 추론 등 다양한 코딩 작업에서 탁월한 성능을 발휘하는 효율적이고 고성능의 코드 LLM에 대한 필요성을 해결합니다.
- Yi-Coder는 소규모 코드 LLM의 한계를 뛰어넘어 소프트웨어 개발을 가속화하고 혁신할 수 있는 사용 사례를 발굴하는 것을 목표로 합니다.
어떻게 문제를 해결하나요?
- Yi-Coder는 인상적인 성능을 달성하기 위해 여러 기술을 조합하여 활용합니다.
- 52개 주요 프로그래밍 언어에 걸쳐 2조 4천억 개에 달하는 방대한 리포지토리 수준의 코드 코퍼스와 CommonCrawl에서 필터링된 코드 관련 데이터를 기반으로 학습합니다.
- 또한 Yi-Coder는 최대 128K 토큰의 긴 컨텍스트 모델링을 사용하여 프로젝트 수준의 코드를 이해하고 생성할 수 있습니다. 비교적 작은 크기(1.5억 및 9억 매개변수)에도 불구하고 Yi-Coder는 다양한 코딩 벤치마크 및 작업에서 대형 모델보다 뛰어난 성능을 발휘합니다.
다음 단계는 무엇인가요?
- 기본 버전과 채팅 버전 모두에서 Yi-Coder 1.5B/9B의 오픈 소스 릴리스는 커뮤니티가 이 강력한 코드 LLM을 탐색하고 프로젝트에 통합할 수 있는 흥미로운 기회를 제공합니다.
- 개발자는 Yi-Coder의 기능을 활용하여 소프트웨어 개발 프로세스를 개선하고, 코딩 작업을 자동화하며, 소규모 코드 LLM이 달성할 수 있는 한계를 뛰어넘을 수 있습니다.
- Yi-Coder 팀은 개발자가 Yi-Coder README와 같은 제공된 리소스를 살펴보고 Discord 또는 이메일을 통해 커뮤니티에 참여하여 문의 및 토론을 할 것을 권장합니다.

참고: 프롬프트 엔지니어링 Thought 시리즈(https://aiheroes.ai/community/153)

출처: The Next Level of CoT Prompting(https://www.linkedin.com/pulse/next-level-cot-prompting-pascal-biese-e08pf/)

🧠 The Next Level of CoT Prompting

www.linkedin.com

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 9월 8일 오후 2:33

저장 14 • 조회 2,287

함께 읽은 게시물

강재상

스타트업 육성, Corprate Venturing, 사업, 커리어, 작가

5월 11일

여전히 나이를 중요하게 여기는 우리나라에서 사회생활할 때 가장 큰 변곡점이 오는 나이는 40세다. 물론 20대말과 30대 중반, 40대 중반, 50대에도 중간중간 크고 작은 변곡점이 있기는 하지만, 다시 돌이키기 어려울 정도로 이후 방향을 고착화시킨다는 의미에서, 혹은 현재 커리어패스가 중심이 아니라 이후 인생 2막이나 3막을 자발적이던 강제적이던 가야하는 상황은 아니라는 의미에서, 사회생활 시작과 함께 만들어온 커리어패스를 가지고 일을 할 수 있다는 기준에서 볼 때, 40세는 상징적이다.

60세면 당연히 할아버지, 할머니 소리를 들으면서 70세 전후에 죽는게 당연했던 불과 20여년 전까지만해도 예전의 40세는 일하고 있는 산업과 분야에서 전문성과 리더십을 충분히 갖추고 있는 베테랑으로 이제 그동안 쌓아온 역량과 네트워킹으로 퇴직할 때까지

저장 3 • 조회 1,439

한성규

'지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

3일 전

👋 프로세스를 촘촘하게 만드는 사람

쿠

프로세스를 촘촘하게 만드는 사람

기억보단 기록을

저장 3 • 조회 403

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

5일 전

알람 소리에 반사적으로 일어나서 준비를 마치고 정신없이 이동하면 어느새 사무실 책상에 앉아 있게 됩니다. 동료들과 인사를 마치고 컴퓨터를 켜는 순간 업무는 시작되지요.

직장 다니면서 제대로 ‘현타’ 맞는 순간 7

다음 - 피플앤잡

저장 3 • 조회 687

골빈해커

Chief Maker

5월 20일

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트 레포에 써 보았습니다.

테스트가 있으면 스스로 테스트도 실행하고, 만든거 스스로 실행해보면서 버그도 수정하고 하는게 기특하긴 합니다.

댓글 3 • 저장 7 • 조회 2,715

장홍석

스페이스오디티 부대표/CPO

2일 전

< 당신이 경험한 것이 곧 당신이라는 착각 >

1. 미아가 된 영혼이란 한 인간의 생각과 감정과 시각, 청각, 미각, 후각, 촉각이 모두 감쪽같이 일치하는 곳에 빠져든 의식이다.

댓글 1 • 저장 2 • 조회 669

K리그 프로그래머

커피한잔 개발자

5월 21일

작은 성공의 기쁨

목

작은 성공의 기쁨

K리그 프로그래머

저장 2 • 조회 2,486

비슷한 게시물

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

프롬프트 최적화 전략을 소개합니다

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

프로그래밍은 배려의 언어입니다.

골빈해커 Chief Maker

📝 Llama 3 8B은 양자화 시 Llama 2 7B보다 성능 저하가 더 두드러진다고

서지연 개발자

프롬프트 엔지니어링은 죽었다?

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0823]모두에게 전하는 모두연 AI뉴스!

HoJoong Kim Senior IT guy

개발자를 위한 프롬프트 엔지니어링: 완벽한 가이드!

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

김하림 우아한형제들 프론트엔드 개발자

타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

Arawn Park Senior Engineer & Engineering Lead

나는 시스템 빌더이다

석민 커리어 코치

이직의 조건

골빈해커 Chief Maker

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트

동크루트 AI 엔지니어, SW 엔지니어

샘 알트만: "지금 당신이 o3보다 더 똑똑하다고 생각하세요?"

장홍석 스페이스오디티 부대표/CPO

< '네이버 다녀요'라는 말에 아무도 무슨 일을 하는지는 묻지 않

장홍석 스페이스오디티 부대표/CPO

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와

송요창 배민 프론트엔드 프로그래머

ChatGPT 버전명 설명

레드버스백맨 리서처 앤 라이터

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것

[AI] 다음 단계의 CoT 프롬프팅

댓글 0

함께 읽은 게시물

👋 프로세스를 촘촘하게 만드는 사람

< 당신이 경험한 것이 곧 당신이라는 착각 >

작은 성공의 기쁨

비슷한 게시물

주간 인기 TOP 10

추천 프로필