오늘 발표된 Llama 4 Scout 의 컨텍스트 윈도우 크기인 10M(천만개) 토큰이 어느정도 수준인지 느낌적인 느낌으로 알아봅시다.


평균적으로 단어당 약 1.2개의 토큰이니, 75%라고 치고 총 7.5M 개의 단어를 담을 수 있다고 하면, 일반적인 문고판 책 기준으로 약 100권이니 책장 한 개 정도. 영화 대본으로는 약 350편 이상을 담을 수 있습니다.


다른 예로, 리눅스 커널의 전체 라인수는 약 40M 로, 한 줄당 평균 5개의 토큰을 사용한다고 하면, 200M 정도의 토큰을 가지고 있는건데요.


즉, Llama 4 Scount 를 20개만 띄워놓고 있으면 세상에서 가장 큰 코드 베이스 중 하나인 리눅스도 RAG 없이 모든 디테일을 정확히 참조하며 개발 할 수 있다는 말이 됩니다.


이미 지금도 매우 크지만, 컨텍스트 윈도우가 1B 이상 되면 또 다시 완전히 다른 세상이 될겁니다. RAG라는 개념이 사라지진 않겠지만, LLM 사용시 데이터 참조 방법에 대해서 완전히 다른 접근법을 취해야되겠죠.


그리고 그 시기는 생각보다 금방 올 지도 모르겠습니다.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 4월 6일 오전 6:34

댓글 0

    함께 읽은 게시물

    6월 초, 새로운 바이브 코딩과 SW 개발의 전환의 시대

    ... 더 보기

    2025년 2분기 AI 세미나

    55check.imweb.me

    2025년 2분기 AI 세미나

    “직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던가, 이 일이 날 성장시킨다던가, 이 일이 좋다던가, 이게 다 여기에 해당합니다.“ 박웅현 TBWA 코리아 조직문화연구소 소장은 직원들을 조직에 남게하는 방법을 이렇게 제안했다.

    ... 더 보기

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    뉴시스

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    데이터 이야기 #4: 기본 데이터 직군 - 데이터 분석가

    앞서 포스팅에서는 데이터 팀의 목적이 무엇이고 어떻게 가치를 생성하는지 이야기해보았다. 이번 포스팅에서는 기본 데이터 직군이라 할 수 있는 데이터 엔지니어, 데이터 분석가, 데이터 과학자에 대해 이야기해보고자 한다.

    ... 더 보기

    전략적 입사 지원

    ... 더 보기

     • 

    저장 20 • 조회 1,416


    데이터 분석가로 취업은 했는데 분석은 못하고 쿼리 머신이 되는 것 같아요

    데이터 분석가 취업, 이직, 커리어와 관련된 고민, 걱정 물어볼 곳이 없어 속으로만 삭히고 계신가요? 현업 데이터 분석가 선배들에게 무엇이든 물어보세요. 이 세미나에 관심 있을 것 같은 동료, 친구, 지인이 있다면 세미나 소식을 공유해주세요 :) 세미나 자세히 알아보기 👉 https://bit.ly/3Zn3Yor [ 지금까지 들어온 질문들 ] ✔ 데이터 분석가의 업무 범위는 어느 정도 될까요? ✔ 데이터 분석가가 되기 위해 하셨던 공부는 어떤 것이 있을까요? 도움을 받은 책은 무엇일까요? ✔ 데이터 분석가로 취업... 더 보기

    [서평] 주니어가 읽기 좋은 책 <데이터 드리븐 리포트>

    ... 더 보기

    데이터 드리븐 리포트

    Hanbit

    데이터 드리븐 리포트

     • 

    저장 1 • 조회 330