MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
arXiv.org
얼마전에 아이폰에 Gemini가 들어갈 수도 있다는 기사를 봤는데요, 사실 애플도 LLM 모델을 개발하고 있었고, 30B 파라미터의 MM1이라는 모델을 공개했습니다. mixture-of-experts(MoE)
모델을 사용해서 클라우드에서 구동하는 것보다 아이폰이나, 아이패드 등 작은 기기에서도 구동이 가능하게 작업한게 특징인데요. 애플이 어떤 결론을 낼지 궁금해집니다
https://arxiv.org/abs/2403.09611
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 3월 22일 오전 8:37