[240415] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

모두의연구소는 지식을 나누며 함께 성장하는 국내 최대 SW/AI 커뮤니티입니다.


🗞️ SW/AI 한줄 뉴스
1. AI칩 전쟁 뛰어든 메타
https://n.news.naver.com/mnews/hotissue/article/008/0005024635?type=series&cid=2001161


2. 2년내 AI가 인간 능가" 머스크 발언에 1000만달러 내기 제안 등장
https://www.aitimes.com/news/articleView.html?idxno=158726

-

🤵‍♂️ 빠르다 빨라 AI 세상
1. Infini-Transformer: 무한한 입력 길이를 다루는 혁신적 LLM
Infini-Transformer는 Transformer 기반 대형 언어 모델(LLM)을 무한히 긴 입력에 확장 가능하도록 만드는 효율적인 방법을 소개한다. 핵심 기술은 Infini-attention이라 불리는 새로운 어텐션 기법으로, 기존 어텐션 메커니즘에 압축 메모리를 통합하고 한 개의 Transformer 블록 안에 마스크된 로컬 어텐션과 장기 선형 어텐션 메커니즘을 모두 구축한다. 이를 통해 Infini-Transformer는 제한된 메모리와 연산으로 장기 문맥을 효율적으로 모델링할 수 있게 된다. 실험 결과 제안 모델이 장문 언어 모델링, 100만 길이 패스키 추출, 50만 길이 책 요약 등의 태스크에서 기존 대비 우수한 성능을 보였다.
https://huggingface.co/papers/2404.07143


2. RULER: 장문맥 언어모델 평가의 새로운 기준
RULER는 장문맥 언어모델의 능력을 종합적으로 평가하기 위해 retrieval, multi-hop tracing, aggregation, question answering의 네 가지 태스크 카테고리를 포함한 새로운 벤치마크이다. RULER는 기존의 vanilla needle-in-a-haystack 테스트에 비해 단순 검색 이상의 다양한 행동을 테스트하며, 입력 시퀀스 길이와 태스크 복잡도를 유연하게 조절할 수 있는 synthetic 태스크로 구성된다. RULER를 통해 최대 128K 길이의 문맥에 대해 10개의 장문맥 언어모델을 평가한 결과, 대부분의 모델이 문맥 길이가 길어질수록 성능 저하를 보였으며, 32K 이상의 유효한 문맥 길이를 보인 모델은 4개에 불과했다. RULER는 장문맥 언어모델 개발에 있어 보다 종합적이고 체계적인 평가를 가능하게 해줄 것으로 기대된다.
https://huggingface.co/papers/2404.06654

-

🦸‍♂️ 오늘의 SW 스피드웨건
1. Next.js 14.2 릴리즈
Next.js 14.2 버전은 개발, 생산, 캐싱의 성능 개선이 이루어졌습니다. 특히, 로컬 개발 성능 향상을 위해 Turbopack Release Candidate를 도입했고, CSS 최적화 및 메모리 사용량 감소 등의 빌드 및 생산 개선이 있었습니다. 또한, 클라이언트 측 라우터 캐시의 새로운 설정 가능한 invalidation 기간 옵션인 staleTimes를 실험적으로 도입했습니다. 사용자들은 이제 캐시 무효화 기간을 자유롭게 설정할 수 있습니다
https://nextjs.org/blog/next-14-2


2. Django 백엔드에서 동적 작업 스케줄링 및 동시 실행(Redis <-> RQScheduler <-> Celery)
새로운 SaaS 플랫폼에서 동적 스케줄링과 동시 작업 실행 문제에 직면하여, 우리는 Redis의 정렬된 집합을 이용한 태스크 스케줄링 및 관리 솔루션을 개발했습니다. 이를 통해 동적인 스케줄 변경에 효과적으로 대응할 수 있으며, 고유한 문자열과 우선 순위 또는 실행 시간을 나타내는 점수를 사용하여 태스크를 저장합니다. 이 구조는 우선 순위가 높은 태스크가 우선 실행되도록 보장합니다. 최종 아키텍처는 별도의 프로듀서 프로세스, 스케줄러, 작업자 프로세스를 포함하며, RQ-scheduler 라이브러리를 사용하여 구현되었습니다.
https://suprsend.tech/redis-rqscheduler-celery-for-dynamic-task-scheduling-and-concurrent-execution-in-django-backend

-

🤖 AI학교 아이펠 온라인 8기 ► https://bit.ly/3T1rC8r
📊 AI학교 아이펠 데이터 사이언티스트 온라인 2기 ► https://bit.ly/3JjDKNu
💻 오름캠프 Django 백엔드 개발 과정 온라인 2기 ► https://bit.ly/3UdtWej

[IT썰] 메타도 'AI칩 전쟁' 뛰어들었다..."성능 3배 뛰어나"

n.news.naver.com

[IT썰] 메타도 'AI칩 전쟁' 뛰어들었다..."성능 3배 뛰어나"

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 4월 15일 오전 1:47

 • 

조회 955

댓글 0