🩵모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다.
그럼, 오늘의 AI 뉴스 시작해 볼게요! :)
1️⃣TSMixer: 단변량 성능을 갖춘 다변량 시계열 예측 모델
(https://blog.research.google/2023/09/tsmixer-all-mlp-architecture-for-time.html)
시계열 예측은 다양한 분야에서 중요하며, 단변량 모델과 다변량 모델 두 가지 유형이 있습니다. 단변량 모델은 한 변수의 시계열 패턴에 초점을 맞추고, 다변량 모델은 여러 변수의 시계열 패턴과 교차 변수 정보를 처리합니다. 딥러닝 트랜스포머 기반의 다변량 모델은 시퀀스 작업에서 탁월한 성능을 보이지만, 일부 장기 예측 벤치마크에서는 단변량 선형 모델보다 성능이 낮게 나타납니다.“TSMixer: 시계열 예측을 위한 All-MLP 아키텍처” 연구에서는 단변량 선형 모델의 장점을 분석하여 새로운 다변량 모델인 TSMixer를 개발하였으며, 이 모델은 단변량 모델만큼 우수한 성능을 보여줍니다. 다양한 최신 모델과 비교했을 때 TSMixer는 더 뛰어난 성능을 갖는다고 하니 자세한 내용은 링크에서 확인해보세요!
2️⃣OpenAI DevDay: 샌프란시스코에서 열리는 첫 개발자 컨퍼런스 소개
(https://openai.com/blog/announcing-openai-devday)
2023년 11월 6일, 샌프란시스코에서 OpenAI DevDay라는 첫 번째 개발자 컨퍼런스가 열립니다! 이번 행사에는 전 세계 개발자들이 OpenAI와 함께 모여 새로운 도구와 아이디어를 공유할 예정이며, 브레이크아웃 세션에도 참여할 수 있다고합니다.OpenAI는 2020년부터 API를 제공하여 2백만 명 이상의 개발자가 GPT-4, GPT-3.5, DALL-E 및 Whisper를 다양한 애플리케이션과 서비스에 적용하고 있습니다. OpenAI의 CEO 샘 알트먼은 개발자 지원을 위한 새로운 작업 발표에 기대감을 표현했습니다. 행사 등록은 devday.openai.com에서 가능하며, 언론 문의는 devdaypress@openai.com을 통해 할 수 있다고 하니 놓치지 마세요!
3️⃣TII에서 공개한 최대 규모의 공개 언어 모델 'Falcon 180B' 발표
(https://huggingface.co/blog/falcon-180b)
TII는 허깅페이스 블로그를 통해 Falcon 180B를 발표했습니다. 이는 1,800억 개의 파라미터를 포함하며, RefinedWeb 데이터 세트의 3조 5천억 개 토큰으로 학습된 최대 규모의 공개 언어 모델입니다.Falcon 180B는 허깅페이스 허브와 팔콘 채팅 데모에서 확인 및 상호 작용이 가능합니다. 이 모델은 다양한 자연어 처리 작업에서 최고의 성과를 보여주며, PaLM-2와 같은 최첨단 독점 모델과 비교될 수 있습니다. 해당 모델의 성능과 사용 방법에 대한 상세한 내용은 블로그 게시물에서 확인할 수 있습니다.
⎯
📍 AI학교 아이펠 7기 무료 입학하기! → https://bit.ly/3YDkLV4