[240415] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

모두의연구소는 지식을 나누며 함께 성장하는 국내 최대 SW/AI 커뮤니티입니다.

🗞️ SW/AI 한줄 뉴스
1. AI칩 전쟁 뛰어든 메타
https://n.news.naver.com/mnews/hotissue/article/008/0005024635?type=series&cid=2001161

2. 2년내 AI가 인간 능가" 머스크 발언에 1000만달러 내기 제안 등장
https://www.aitimes.com/news/articleView.html?idxno=158726

🤵‍♂️ 빠르다 빨라 AI 세상
1. Infini-Transformer: 무한한 입력 길이를 다루는 혁신적 LLM
Infini-Transformer는 Transformer 기반 대형 언어 모델(LLM)을 무한히 긴 입력에 확장 가능하도록 만드는 효율적인 방법을 소개한다. 핵심 기술은 Infini-attention이라 불리는 새로운 어텐션 기법으로, 기존 어텐션 메커니즘에 압축 메모리를 통합하고 한 개의 Transformer 블록 안에 마스크된 로컬 어텐션과 장기 선형 어텐션 메커니즘을 모두 구축한다. 이를 통해 Infini-Transformer는 제한된 메모리와 연산으로 장기 문맥을 효율적으로 모델링할 수 있게 된다. 실험 결과 제안 모델이 장문 언어 모델링, 100만 길이 패스키 추출, 50만 길이 책 요약 등의 태스크에서 기존 대비 우수한 성능을 보였다.
https://huggingface.co/papers/2404.07143

2. RULER: 장문맥 언어모델 평가의 새로운 기준
RULER는 장문맥 언어모델의 능력을 종합적으로 평가하기 위해 retrieval, multi-hop tracing, aggregation, question answering의 네 가지 태스크 카테고리를 포함한 새로운 벤치마크이다. RULER는 기존의 vanilla needle-in-a-haystack 테스트에 비해 단순 검색 이상의 다양한 행동을 테스트하며, 입력 시퀀스 길이와 태스크 복잡도를 유연하게 조절할 수 있는 synthetic 태스크로 구성된다. RULER를 통해 최대 128K 길이의 문맥에 대해 10개의 장문맥 언어모델을 평가한 결과, 대부분의 모델이 문맥 길이가 길어질수록 성능 저하를 보였으며, 32K 이상의 유효한 문맥 길이를 보인 모델은 4개에 불과했다. RULER는 장문맥 언어모델 개발에 있어 보다 종합적이고 체계적인 평가를 가능하게 해줄 것으로 기대된다.
https://huggingface.co/papers/2404.06654

🦸‍♂️ 오늘의 SW 스피드웨건
1. Next.js 14.2 릴리즈
Next.js 14.2 버전은 개발, 생산, 캐싱의 성능 개선이 이루어졌습니다. 특히, 로컬 개발 성능 향상을 위해 Turbopack Release Candidate를 도입했고, CSS 최적화 및 메모리 사용량 감소 등의 빌드 및 생산 개선이 있었습니다. 또한, 클라이언트 측 라우터 캐시의 새로운 설정 가능한 invalidation 기간 옵션인 staleTimes를 실험적으로 도입했습니다. 사용자들은 이제 캐시 무효화 기간을 자유롭게 설정할 수 있습니다
https://nextjs.org/blog/next-14-2

2. Django 백엔드에서 동적 작업 스케줄링 및 동시 실행(Redis <-> RQScheduler <-> Celery)
새로운 SaaS 플랫폼에서 동적 스케줄링과 동시 작업 실행 문제에 직면하여, 우리는 Redis의 정렬된 집합을 이용한 태스크 스케줄링 및 관리 솔루션을 개발했습니다. 이를 통해 동적인 스케줄 변경에 효과적으로 대응할 수 있으며, 고유한 문자열과 우선 순위 또는 실행 시간을 나타내는 점수를 사용하여 태스크를 저장합니다. 이 구조는 우선 순위가 높은 태스크가 우선 실행되도록 보장합니다. 최종 아키텍처는 별도의 프로듀서 프로세스, 스케줄러, 작업자 프로세스를 포함하며, RQ-scheduler 라이브러리를 사용하여 구현되었습니다.
https://suprsend.tech/redis-rqscheduler-celery-for-dynamic-task-scheduling-and-concurrent-execution-in-django-backend

🤖 AI학교 아이펠 온라인 8기 ► https://bit.ly/3T1rC8r
📊 AI학교 아이펠 데이터 사이언티스트 온라인 2기 ► https://bit.ly/3JjDKNu
💻 오름캠프 Django 백엔드 개발 과정 온라인 2기 ► https://bit.ly/3UdtWej

[IT썰] 메타도 'AI칩 전쟁' 뛰어들었다..."성능 3배 뛰어나"

n.news.naver.com

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 4월 15일 오전 1:47

•

조회 955

비슷한 게시물

주간 인기 TOP 10

골빈해커 Chief Maker

요 며칠 GPT-5 Reasoning - High 를 사용해서 진

K리그 프로그래머 커피한잔 개발자

내가 가본 우리나라

석민 커리어 코치

확신은 어디에서 오는가?

김선호 여기어때컴퍼니 / User Behavior Team Lead

매우 공감하는 글. 좀 더 첨언해보자면, - 문제가 뭔지 정의하

장홍석 스페이스오디티 부대표/CPO

< 모른다고 말하는 순간, 뇌도 멈춘다 >

Arawn Park Senior Engineer & Engineering Lead

JSpecify로 끝내는 NPE 전쟁

마케터 초인(윤진호) 초인 마케팅랩 LEADER

타인의 평가자가 되어 삶을 허비하지 않기로 하였다

달레 Apollo GraphQL Software Engineer

재미있는 함수에 대해 배워볼까요! 😄

김현청 | Hyuncheong KIM 블루에이지 회장 | 서울리더스클럽회장 | (사)도서관산업협회 회장

일과 사랑, 그리고 인생을 위한 명언 1697개

서지연 개발자

📰 개발자로서 읽어야 할 책 8권 ✍️ dev.to에 올라온

[240415] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

댓글 0

비슷한 게시물

주간 인기 TOP 10

추천 프로필