구글, Gemini 1.5 발표 : 100만 토큰 처리가 가능해집니다.

지난 주 Google Gemini Advanced 오픈 이후에 이번에는 Gemini 1.5 모델을 발표했습니다.

Gemini 1.5 Pro 주요 내용


1. MoE(Mixture of Expert) 아키텍처를 기반으로 제공합니다.

- 이는 더 적은 컴퓨팅 자원으로 Gemini 1.0 울트라에 필적하는 성능을 제공함을 의미합니다.

- 유출된 정보에 따르면 GPT-4 도 MoE 로 구성되어 있다고 알려져 있습니다.

- 오픈 모델인 Mistral 도 MoE 를 도입한 Mixtral 8x7B 가 꽤 좋은 성능을 내고 있습니다.


2. 최대 100만 토큰까지 컨텍스트를 처리합니다.

- Gemini 1.0의 3만 2천 토큰을 넘어 Gemini 1.5 Pro는 최대 100만 토큰까지 처리할 수 있게 되었습니다.

- 현재 GPT-4 는 12.8만, Claude-2는 20만 토큰을 지원합니다.

- 12만 8천개의 토큰 컨텍스트 윈도우가 기본 제공되며, 제한된 그룹의 개발자 및 기업 고객들을 대상으로 100만 토큰을 지원합니다.

- 자체 연구에서는 최대 1,000만 개의 토큰까지도 성공적으로 테스트했다고 합니다.


3. 멀티 모달 이해와 추론 능력 향상

- 동영상을 포함한 다양한 형식에 대해 고도로 정교한 이해와 추론 작업을 수행할 수 있습니다.

- 데모에서는 44분 분량의 무성 영화를 기반으로 대화를 하는데 아래와 같이 이미지를 넣고 영상 시간을 알려달라고 하니 영상 중 유사한 장면의 시간이 찾아집니다.


4. 컨텍스트가 커져도 높은 성능을 유지합니다.

- 1,000만개의 토큰 텍스트 문서내의 정보를 99.2%의 정확도로 찾아낼 수 있습니다.

- 기존 모델들이 컨텍스트가 길어짐에 따라 정확도가 급격히 떨어지던 문제 (Lost in the Middle) 를 해결했습니다.


5. 광범위한 윤리 및 안전 테스트

- 책임감 있는 배포를 위해 콘텐츠 안전 및 표현의 유해성 등 여러 영역에 걸쳐 광범위한 평가를 실시했습니다.

현재 Gemini 1.5 Pro는 구글 AI Studio 에서 waitlist 신청을 통해 사용가능 합니다.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 2월 17일 오전 11:39

 • 

저장 11조회 5,729

댓글 0