밑바닥 부터 만드는 LLM

LLM을 처음부터 만들어보는 과정을 담은 책입니다.

목차는 다음과 같습니다.


  • 대규모 언어 모델 이해하기

  • 텍스트 데이터 다루기

  • 어텐션 메커니즘 코딩하기

  • GPT 모델을 처음부터 구현하여 텍스트 생성하기

  • 비라벨 데이터에 대한 사전 학습

  • 분류를 위한 미세 조정

  • 지침을 따르도록 미세 조정


웹에서 무료로 볼 수 있으니 관심있으신 분은 한번 보시길 바랍니다.


https://www.manning.com/books/build-a-large-language-model-from-scratch

Build a Large Language Model (From Scratch)

Manning Publications

Build a Large Language Model (From Scratch)

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 8월 26일 오전 6:37

 • 

저장 14조회 2,294

댓글 0

    함께 읽은 게시물

    구현패턴으로 DB사용비용을 10배줄이기

    ... 더 보기

    kopring-reactive-labs/Docs/eng/08_bulkprocessor.md at main · psmon/kopring-reactive-labs

    GitHub

    kopring-reactive-labs/Docs/eng/08_bulkprocessor.md at main · psmon/kopring-reactive-labs

     • 

    댓글 1 • 저장 32 • 조회 2,644


    제가 리드하고 있는 조직(당근마켓 커뮤니티실)에서 백엔드 엔지니어를 채용 중이에요.


    커뮤니티실에는 동네 이웃들의 이야기와 정보를 공유하는 동네생활팀, 이웃 간의 취미와 관심사를 연결하는 모임팀, 그리고 아파트 단지 생활을 더 편리하고 즐겁게 만들어 줄 단지팀이 있어요. 지금 내 동네에서 일어나고 있는 일들을 더 쉽게 즐기고 공유할 방법들을 찾는 일이라면 무엇이든 도전하여 실행에 옮겨요. 만드는 사람이 불편할수록 쓰는 사람은 편하다는 믿음으로 도전적인 문제를 풀어나갈 분과 함께하고자 해요.

    ... 더 보기

    🤖 최초의 AI 브라우저, Dia 직접 써봤습니다! 🌐

    ... 더 보기

    조회 371


    워케이션 문화가 없는 조직에서 워케이션 시도하기

    ... 더 보기

    Paywatch Tech

    tech.paywatch.co.kr

    Paywatch Tech


    혹시 Cursor 채팅만 사용하시나요? Agent 쓰는 방법!

    Cursor와 함께라면, 더이상 에디터는 단순한 입력 도구가 아닌

    ... 더 보기