지난 주 Google Gemini Advanced 오픈 이후에 이번에는 Gemini 1.5 모델을 발표했습니다.
Gemini 1.5 Pro 주요 내용
1. MoE(Mixture of Expert) 아키텍처를 기반으로 제공합니다.
- 이는 더 적은 컴퓨팅 자원으로 Gemini 1.0 울트라에 필적하는 성능을 제공함을 의미합니다.
- 유출된 정보에 따르면 GPT-4 도 MoE 로 구성되어 있다고 알려져 있습니다.
- 오픈 모델인 Mistral 도 MoE 를 도입한 Mixtral 8x7B 가 꽤 좋은 성능을 내고 있습니다.
2. 최대 100만 토큰까지 컨텍스트를 처리합니다.
- Gemini 1.0의 3만 2천 토큰을 넘어 Gemini 1.5 Pro는 최대 100만 토큰까지 처리할 수 있게 되었습니다.
- 현재 GPT-4 는 12.8만, Claude-2는 20만 토큰을 지원합니다.
- 12만 8천개의 토큰 컨텍스트 윈도우가 기본 제공되며, 제한된 그룹의 개발자 및 기업 고객들을 대상으로 100만 토큰을 지원합니다.
- 자체 연구에서는 최대 1,000만 개의 토큰까지도 성공적으로 테스트했다고 합니다.
3. 멀티 모달 이해와 추론 능력 향상
- 동영상을 포함한 다양한 형식에 대해 고도로 정교한 이해와 추론 작업을 수행할 수 있습니다.
- 데모에서는 44분 분량의 무성 영화를 기반으로 대화를 하는데 아래와 같이 이미지를 넣고 영상 시간을 알려달라고 하니 영상 중 유사한 장면의 시간이 찾아집니다.
4. 컨텍스트가 커져도 높은 성능을 유지합니다.
- 1,000만개의 토큰 텍스트 문서내의 정보를 99.2%의 정확도로 찾아낼 수 있습니다.
- 기존 모델들이 컨텍스트가 길어짐에 따라 정확도가 급격히 떨어지던 문제 (Lost in the Middle) 를 해결했습니다.
5. 광범위한 윤리 및 안전 테스트
- 책임감 있는 배포를 위해 콘텐츠 안전 및 표현의 유해성 등 여러 영역에 걸쳐 광범위한 평가를 실시했습니다.
현재 Gemini 1.5 Pro는 구글 AI Studio 에서 waitlist 신청을 통해 사용가능 합니다.
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 2월 17일 오전 11:39