Paper page - TEAL: Tokenize and Embed ALL for Multi-modal Large Language Models
huggingface.co
1.LRM: 대규모 이미지 기반 3D 재구성의 혁신적인 접근
대규모 재구성 모델(LRM)은 단일 입력 이미지에서 물체의 3D 모델을 예측하는 최초의 시도로, 트랜스포머 기반의 아키텍처와 5억 개의 학습 가능한 파라미터를 갖추고 있습니다. 기존의 카테고리별 학습 방식과는 다르게, LRM은 대규모 멀티뷰 데이터를 활용하여 신경 방사장(NeRF)을 직접 예측하도록 엔드투엔드 방식으로 훈련되었습니다. 이 방식은 약 100만 개의 오브젝트가 포함된 다양한 실제 및 생성 이미지에 대한 고품질 3D 재구성을 가능하게 합니다.
https://huggingface.co/papers/2311.04589
2.mPLUG-Owl2: 모듈화된 접근법으로 성능 향상된 멀티모달 언어 모델
mPLUG-Owl2는 모듈화된 디자인과 범용 인터페이스를 통해 텍스트 및 다중 모달 작업 모두에서 성능을 향상시키는 다목적, 다중 모달 대형 언어 모델입니다. 이 모델은 공유 기능 모듈과 모달리티 적응형 모듈을 통합하여 모달리티 간 협업을 용이하게 하고, 각 모달리티의 특징을 보존합니다. 실험 결과 mPLUG-Owl2는 텍스트와 멀티모달 작업 모두에서 최첨단 성능을 달성했으며, 모달리티 협업의 효과를 입증한 최초의 MLLM 모델로, 향후 멀티모달 모델 개발에 중요한 방향을 제시합니다.
https://huggingface.co/papers/2311.04257
3.Vitess 18 발표
Vitess 18이 출시되어 사용성, 성능, MySQL 호환성을 개선하는 새로운 기능들이 추가되었습니다. 주요 업데이트로는 동일 샤드 내에서 Vitess가 관리하는 외래 키 제약 조건 지원, 향상된 Vitess 쿼리 플래너, Cobra를 사용한 CLI 개선, 모든 클라이언트 명령어를 vtctldclient로 이전, 외부 데이터베이스에서 데이터를 거의 중단 없이 마이그레이션할 수 있는 VReplication 및 온라인 DDL 지원 등이 있습니다. 또한, 포인트 인 타임 복구 기능이 강화되었으며, 태블릿 스로틀러가 gRPC 통신을 사용하도록 개선되었습니다. Vitess 18을 사용해보시고 Vitess GitHub이나 Vitess Slack을 통해 피드백을 제공해 주시기 바랍니다.
https://planetscale.com/blog/announcing-vitess-18
4.Discord가 한대의 서버로 2백만명의 동시 사용자를 서빙하는 방법
디스코드는 사용자 기반과 대규모 커뮤니티의 급속한 성장에 대응하기 위해 엘릭서 시스템을 확장해왔습니다. 각 서버에서 발생하는 모든 활동을 각 사용자의 클라이언트 UI에 업데이트하기 위해, 엘릭서 프로세스를 중심 라우팅 포인트로 사용합니다. 이 시스템은 수천 명에서 최대 200만 명의 동시 사용자를 지원할 수 있도록 발전했습니다. 서버의 크기가 커질수록 처리해야 할 작업량도 기하급수적으로 증가하며, 디스코드는 이러한 도전을 해결하기 위해 시스템 성능을 모니터링하고 처리량 및 응답성을 개선하는 방법을 찾아왔습니다.
https://discord.com/blog/maxjourney-pushing-discords-limits-with-a-million-plus-online-users-in-a-single-server
🥇K-디지털 트레이닝 기관 유일! 대통령 표창 수상한 모두의연구소 신뢰받는 SW/AI 교육
☑️ [앵콜모집 중] Microsoft MVP 강창훈 주강사 직강! <자바스크립트 웹 풀스택> 1기 지원하기 → https://bit.ly/3tmITjj
다음 내용이 궁금하다면?
이미 회원이신가요?
2023년 11월 12일 오후 11:26
한
... 더 보기코
... 더 보기