2024 구글 I/O에서 발표된 100가지 주요 내용
구글에서 이번 구글I/O의 주요 발표 내용들을 발표하였습니다. 카테고리로만 보면 100가지는 아니지만 어째튼 참고할만합니다. 내용이 너무 많아서 다 기억을 못하겠지만요...^^
더욱 새로워진 AI와 모델
1. 경량 모델인 제미나이 1.5 플래시(Gemini 1.5 Flash)공개
https://blog.google/technology/developers/gemini-gemma-developer-updates-may-2024/
2. 다양한 작업에서 범용적인 성능을 보여주는 최고의 모델, 제미나이 1.5 프로(Gemini 1.5 Pro)
3. 제미나이 1.5 프로 및 1.5 플래시는 구글 AI 스튜디오(Google AI Studio) 및 버텍스 AI(Vertex AI)에서 100만개의 토큰 컨텍스트 윈도우가 제공되는 공개용 미리보기로 사용가능
Google AI 스튜디오: https://aistudio.google.com/app/waitlist/97595554?utm_source=blog&utm_medium=referral&utm_campaign=keyword&utm_content=
버텍스 AI: https://cloud.google.com/earlyaccess/cloud-ai?e=48754805&hl=en
4. 개발자들은 구글 AI 스튜디오와 버텍스 AI 대기자 명단을 통해 200만개의 토큰 컨텍스트 윈도우를 제공하는 제미나이 1.5 프로 사용 가능
5. 미래의 AI 비서 프로젝트 아스트라(Project Astra) 공개
https://www.youtube.com/watch?v=nXVvvRhiGjI&ab_channel=Google
6. 6세대 TPU 트릴리움(Trillium)공개
https://cloud.google.com/blog/products/compute/introducing-trillium-6th-gen-tpus
7. 트릴리움 TPU는 TPU v5e 대비 칩당 최대 컴퓨팅 성능이 4.7배 향상
8.트릴리움 TPU가 TPU v5e에 비해 에너지 효율성 67% 이상 향상
9. 업로드된 소스 자료로 이용자에 맞춰진 대화형 오디오 대화를 생성할 수 있는 노트북LM(NotebookLM)의 오디오 개요(Audio Overviews) 기능의 초기 프로토타입을 시연
https://notebooklm.google/?location=unsupported
10. 제미나이 모델을 전세계 지식, 다양한 범위의 주제 및 인터넷 상의 최신 정보와 연결하는 그라운딩 위드 구글 서치(Grounding with Google Search)는 버텍스 AI에서 정식으로 이용 가능
11. 제미나이 API 및 AI 스튜디오에 오디오 인식 기능을 추가해 제미나이 1.5 프로가 AI 스튜디오에 업로드된 동영상의 이미지와 오디오를 모두 추론 가능케
12. 픽셀 디바이스를 시작으로, 멀티모달 제미나이 나노(Gemini Nano with Multimodality)를 사용하는 앱들은 이제 시각, 청각, 음성, 언어 등 다양한 정보를 맥락 이해 및 허용
13. 제임스 마니카(James Manyika), 제프 딘(Jeff Dean), 코라이 카바쿨루(Koray Kavukcuoglu)와 개발자들을 초청해 구글 AI의 원동력이 되는 기술 및 연구에 대한 심도 깊은 좌담회 진행
생성형 미디어 모델과 실험 중인 랩스 기능들
14. 최고 품질의 텍스트-이미지 변환 모델인 이마젠 3(Imagen 3) 출시
https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/#Imagen-3
15. 이마젠 3은 자연어와 프롬프트의 의도를 잘 이해할 뿐 아니라 긴 프롬프트의 작은 디테일까지도 반영. 이를 통해 시각적 결함이 훨씬 적은 사실적이고 생생한 이미지를 생성
16.이마젠 3은 그간 이미지 생성 모델들이 가장 어려워하던 텍스트 렌더링에서도 최고의 결과 도출
이마젠 3은 신뢰할 수 있는 이미지 FX 내 이용자들을 대상으로 공개될 예정이며, 대기자 명단에 등록해 참여 가능
18. 또한 올 여름부터 버텍스 AI에서도 출시 예정
19. 비디오 생성 모델인 비오(Veo) 공개: 다양한 시네마틱 비주얼 스타일로 1분 이상의 고화질 1080p 해상도 동영상을 생성
https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/#veo
20. 향후 비오의 일부 기능을 유튜브 쇼츠 및 기타 제품에서도 제공할 예정
21. 또한 도널드 글로버(Donald Glover)를 비롯한 영화 제작자들과도 협력 예정
22. 구글은 스크래치에서 새로운 악기 세션을 만들고, 트래커 간 사운드를 변형하는 등의 창의적인 작업을 가능하게 하는 음악 AI 도구 모음인 뮤직 AI 샌드박스(Music AI Sandbox)공개
https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/#Music-AI-Sandbox
23. 소설 ‘이상한 나라의 앨리스’의 시각적 세계를 재창조하기 위해 구글과 아티스트들이 AI 모델을 미세 조정해 창의적으로 협력한 인피니트 원더랜드(Infinite Wonderland)공개: 인피니트 원더랜드 독자들은 각 작가의 문학적 스타일에 따라 책에 있는 1,200개의 문장 각각에 대해 무한한 이미지를 생성 가능
https://infinitewonderland.withgoogle.com/
24. 구글 딥마인드의 생성형 비디오 모델을 사용하는 최신 실험용 툴인 비오를 활용해 아이디어를 동영상으로 만들어주는 비디오FX(VideoFX) 발표
https://blog.google/technology/ai/google-labs-video-fx-generative-ai/
25. 비디어FX에는 스토리보드 모드가 지원되어 각 장면을 반복하게 하거나 최종 영상에 음악을 믹싱 간으
26. 새로운 편집 기능을 추가, 이미지를 훑어보기만 해도 새로운 요소를 추가, 제거 또는 변경할 수 있는 이미지FX
https://aitestkitchen.withgoogle.com/tools/image-fx
27. 이미지FX는 이마젠 3을 통해 사용할 수 있으며 더 풍부한 디테일은 물론 적은 시각적 아티팩트와 더 정확한 텍스트 렌더링으로 더 사실적인 사진을 생성 가능
28. 생성형 AI의 힘으로 이용자가 장르와 악기에 맞게 박자를 다룰 수 있도록 돕는 뮤직FX의 새로운 기능인 ‘DJ 모드’
https://aitestkitchen.withgoogle.com/tools/music-fx
29. 이번주부터 약 100개국에서 서치랩스를 통해 이미지FX와 뮤직FX를 경험 가능
생성형 미디어 모델과 실험 중인 랩스 기능들
30. 100만 토큰으로 시작하는 대폭 확장된 컨텍스트 윈도우를 자랑할 뿐 아니라 1,500페이지 분량의 PDF와 같은 대용량 문서를 이해할 수 있는 제미나이 어드밴스드(Gemini Advanced) 가입자들을 대상으로 구글의 최첨단 모델 제미나이 1.5 프로(Gemini 1.5 Pro) 제시
31. 전 세계에서 상용화된 챗봇 중 가장 긴 컨텍스트 윈도우를 가지고 있는 제미나이 어드밴스드
32. 구글 드라이브를 활용하거나 이용자 디바이스에서 바로 제미나이 어드밴스드로 파일을 업로드할 수 있는 기도 추가
33. 데이터 분석 기능까지 소화해 스프레드시트와 같이 업로드된 데이터 파일에서 빠르게 인사이트를 발견하고 차트를 작성할 수 있는 기능 추가 예정인 제미나이 어드밴스드
34. 새로운 계획 수립 기능도 갖추고 있어 단순히 추천 활동 목록을 보여주는 것을 넘어, 각 이용자만을 위한 맞춤형 여행 일정을 제안해줄 수 있는 제미나이 어드밴스드
35. 제미나이 라이브를 통해 구글의 최첨단 음성 기술을 사용해 모바일로 제미나이와 더욱 직관적으로 대화할 수 있게 될 예정
36. 10가지 다른 목소리를 제공하며 이용자들은 자신에게 더 자연스러운 음성을 선택해 자신의 속도로 대화하거나 제미나이가 응답하는 도중에 질문하는 등 실제 일상 속 대화처럼 자유롭게 소통할 수 있는 제미나이 라이브
37. 구글 메시지(Google Messages)에서 제미나이를 사용하면 친구에게 메시지를 보내는 앱에서도 제미나이와 대화 가능
38. 제미나이의 맞춤형 버전인 ‘젬(Gems)’을 통해 젬이 해주길 바라는 것과 어떻게 반응하길 원하는지 간단히 설명하는 제미나이가 이를 바탕으로 각 이용자의 요구사항을 충족하는 젬을 생성하는 기능 지원 예정
39. 현재 구글 캘린더(Google Calendar), 구글 태스크(Tasks), 구글 킵(Keep), 구글 시계(Clock) 등 더 많은 구글 앱과 서비스를 제미나이와 연동
더 나은 검색을 위한 업데이트
40. 구글은 구글 검색(Google Search)에 맞춤화된 새로운 제미나이 모델을 통해 다단계 추론, 계획, 멀티모달리티 등 제미나이의 고급 기능을 최고 수준의 구글 검색 시스템과 결합
41. 이번 주부터 미국의 모든 이용자들은 구글 검색의 AI 개요(AI Overviews in Search) 기능을 사용할 수 있으며 곧 더 많은 국가로 확대할 예정
https://blog.google/products/search/generative-ai-google-search-may-2024/
42. 또한 AI 개요에 다단계 추론 기능을 곧 추가해 질문을 나누어 여러 번 검색하거나 복잡한 질문에 대한 답을 한번에 확인 가능하며, 이 업데이트는 곧 미국에서 영어로 서치 랩스의 AI 개요 기능을 통해 이용 가능
43. 새로운 주제를 검색하거나 자료의 요점을 파악할 시 AI 개요를 통해 언어를 단순화하거나 새 더 자세히 설명하도록 하는 옵션도 조만간 출시될 예정
44. 이용자들이 다양한 계획을 세울 수 있도록 돕는 새로운 기능을 연내 구글 검색을 통해 선보일 예정. 서치 랩스의 새로운 계획 기능을 이용하면 맞춤형 식단은 물론 여행 계획도 지원 가능. 이후 운동 및 파티 등 더욱 다양한 카테고리로 확대될 예정
45. 최근 영상 이해 기술의 발전에 힘입어 이제 동영상으로도 질문을 받을 수 있게 된 구글 검색. 복잡한 시각적 자료에 기반한 질문을 풀어 필요한 후속 조치를 설명, 필요한 AI 개요의 기능들을 추천해주기도 하는 구글 검색
46. 생성형 AI가 새로운 아이디어를 찾고 있는 이용자들에게 ‘AI로 정리한 검색 결과(AI-organized result page)’를 제공할 예정인 구글 검색. 이를 통해 이용자들은 음식, 레시피, 영화, 음악, 서적, 호텔, 쇼핑 등 다양한 주제를 검색할 시 AI가 정리한 새로운 검색 결과 페이지를 확인 가능
워크스페이스 및 포토에서 사용 가능한 제미나이 모델
47. 제미나이 1.5 프로를 지메일, 구글 문서, 구글 드라이브, 구글 슬라이드, 구글 시트 등 워크스페이스 랩(Workspace Labs)의 측면 패널에서 확인 가능. 다음 달부터 워크스페이스 이용자들과 구글 원 AI 프리미엄 요금제 구독자들을 대상으로 제미나이 포 워크스페이스(Gemini for Workspace)가 출시 예정
48. 지메일의 측면 패널을 사용해 이메일의 내용을 요약해 가장 핵심적인 내용과 예정된 업무를 확인 가능
49. 또한 조만간 제미나이를 활용한 맥락에 맞는 스마트 회신(Contextual Smart Reply)와 지메일 Q&A(Gmail Q&A) 기능을 지메일 모바일 앱에서 사용 가능
50. 앞으로 몇 주 후면, 지메일과 구글 문서의 글쓰기 도움 기능(Help me write)이 스페인어와 포르투갈어를 지원 예정
51. 연내 랩스를 통해, 제미나이를 활용하여 구글 드라이브(Drive)에서 이메일 첨부파일을 자동으로 정리하거나, 데이터 시트를 생성한 다음 데이터 Q&A로 분석 지원 예정
52. 구글 포토(Google Photo)의 새로운 실험 기능인 ‘사진 묻기’를 사용하면 특정 추억을 찾거나 갤러리에 포함된 정보를 더욱 쉽게 불러올 수 있으며, 제미나이 모델을 사용하며 앞으로 몇 달 안으로 출시될 예정
https://blog.google/products/photos/ask-photos-google-io-2024/
53. 또한 사진 묻기를 통해 최근 여행의 하이라이트 갤러리를 만들 수 있으며, 소셜 미디어에 공유할 수 있도록 맞춤 캡션도 작성 지원
더 발전된 안드로이드
54. 연내 픽셀을 시작으로, 안드로이드 내장형이자 온디바이스 기반 모델인 ‘제미나이 나노’에 멀티모달 기능이 추가.
55. 시각장애인이나 저시력자가 터치 및 음성 피드백을 사용하여 기기와 더 잘 상호 작용할 수 있도록 도와주는 안드로이드 디바이스의 접근성 기능인 토크백(Talkback)이 멀티모달 기능이 탑재된 제미나이 나노로 개선
56. 제미나이 나노의 온디바이스 AI를 사용하여 개인정보를 보호하는 방식으로 사기 전화를 탐지하는 데 도움을 줄 새로운 옵트인(opt-in) 사기 방지 기능 연재 출시 예정
57. 현재 1억 대 이상의 안드로이드 디바이스에서 서클 투 서치(Circle to Search)를 사용할 수 있으며, 연내 사용 가능한 디바이스 수를 두 배로 늘릴 예정
58.안드로이드에서 제미나이를 통해 이미지를 생성하고 지메일(Gmail) 또는 구글 메시지(Google Message) 등으로 드래그 앤 드롭을 할 수 있으며, 시청 중인 유튜브 동영상에 대해 질문 지원 기능 제공 예정.
59. 제미나이 어드밴스드(Gemini Advanced)를 사용하는 경우 여러 페이지를 스크롤하지 않고도 빠르게 답변을 얻을 수 있는 'PDF 물어보기(Ask this PDF)' 옵션 제공
60. 학습에 맞게 미세 조정된 제미나이 기반의 새로운 모델 제품군 ‘런LM(LearnLM)’ 적용으로 일부 안드로이드 스마트폰 및 태블릿에서 서클 투 서치를 사용하여 과제에 도움을 받을 수 있음
61. 올해 말부터는 기호 공식, 다이어그램, 그래프 등과 관련된 훨씬 더 복잡한 문제를 풀 수도 있게 될 서클 투 서치
62.안드로이드 15의 두 번째 베타 버전 출시
63. 강력한 구글 AI(Google AI)를 통해 기기가 도난당했는지 감지하고 신속하게 휴대전화에 있는 정보를 잠그는 도난 감지 잠금 기능(Theft Detection Lock)
64. 안드로이드 15의 프라이빗 스페이스(Private Space) 기능은 추가 인증을 거쳐야먄 열 수 있는 별도의 공간에서 앱을 안전하게 보관할 수 있는 기능 지원
65. 만약 별도의 잠금 화면만으로 프라이빗 스페이스를 관리하는게 충분하지 않으면, 잠금 화면의 존재를 아예 완전히 숨길 수도 있는 기능 지원
66. 온디바이스 AI를 통해 사기나 피싱에 관여하기 위해 자신의 행동을 숨기려는 앱을 발견할 수 있는 구글 플레이 프로텍트(Google Play Protect) 기능이 연내 추가될 예정
67. 일본에서는 구글 메시지(Google Messages)의 RCS를 통해 업데이트된 메시징 경험
68. 빠른 액세스를 위해 이제 보험 카드나 이벤트 티켓 등을 사진으로 찍어 구글 월렛(Google Wallet)에 간편하게 추가할 수 있는 디지털 버전의 패스(미국 only)
69. 증강 현실 콘텐츠를 구글 지도(Google Maps)에서 바로 사용할 수 있는 방법을 선보였으며, 삼성 및 퀄컴과 협력하여 안드로이드 생태계를 위해 구축 중인 확장 현실(XR, extended realiy) 플랫폼의 기반을 마련
70. 내장된 일부 자동차에서 스트리밍 플랫폼의 최신 콘텐츠들을 시청하거나 앵그리버드 게임 지원
71. 몇 달 내 리비안(Rivian)을 시작으로 안드로이드 차량용 OS(Android Automotive OS)가 탑재된 차량에서 구글 캐스트(Google Cast)를 통해 휴대전화의 동영상 콘텐츠를 시청 가능
72. 웨어OS5(Wear OS 5)가 탑재된 스마트워치에는 배터리 수명 최적화 기능이 연내 제공 예정
73. 웨어 OS 5는 피트니스 앱에 지면 접촉 시간, 보폭, 수직 진동 등 다양한 데이터를 확인할 수 있는 옵션 제공
74. 구글 제미나이 모델을 활용해 개인화된 AI 생성 설명을 보고 구글 TV 및 기타 안드로이드 TV OS기반 디바이스에서 시청하고 싶은 콘텐츠를 더 쉽게 선택 가능
75. AI 생성 설명은 영화 및 프로그램에 대해 누락되거나 번역되지 않은 설명 제공
76.패스트 페어(Fast Pair)출시 이후, 이용자들은 10억 개 이상의 장치에 패스트 페어링
77. 이달말부터 내 기기 찾기(Find My Device) 앱에서 키, 지갑, 짐과 같은 물건을 치폴로(Chipolo)나 페블피( PebblePee) 등의 블루투스 추적기 태그에 연결하여 찾기 기능 지원(향후 더 많은 파트너가 추가될 예정)
개발자를 위한 업데이트 사항
78. 개발자들은 제미나이 API 개발자 대회(Gemini API Developer Competition)에 참여하여 가장 유용하고 획기적인 AI 앱을 개발하는데 참여 가능
https://www.youtube.com/watch?v=_cZa_7KaQ3c&ab_channel=Google
79. 시각적 Q&A와 이미지 캡션에 최적화된 최초의 시각 언어 개방형 모델인 팔리젬마(PaliGemma)도 소개
80. 젬마 2는 완전히 새로운 아키텍처를 기반으로 구축되었으며, 젬마 2의 두 배 크기 사이즈 모델들 보다 뛰어난 성능을 제공하며 단일 TPU 호스트에서 실행되는 27B 파라미터 인스턴스를 포함
81. 제미나이 모델을 통해 안드로이드 스튜디오(Android Studio), IDX, 파이어베이스(Firebase), 코랩(Colab), VS코드(VSCode), 클라우드(Cloud), 그리고 인텔리제이(Intellij)의 작업 생산성을 높일 수 있음
82. 제미나이 1.5 프로(Gemini 1.5 Pro)는 연내 안드로이드 스튜디오에 출시될 예정.
83. 영국과 EU를 포함한 200개 이상의 국가에서 구글 AI 스튜디오(Google AI Studio) 사용
84.제미나이 API에서 병렬 함수 호출(Parallel Function Calling)과 비디오 프레임 추출(video frame extraction) 지원
85. 다음 달에 출시될 제미나이 API의 새로운 컨텍스트 캐싱(context caching) 기능을 사용하면 자주 사용하는 컨텍스트 파일을 저렴한 비용으로 캐싱하여 대규모 프롬프트에 대한 워크플로우 간소화
86. 안드로이드는 개발자가 여러 플랫폼에서 앱의 비즈니스 로직을 공유할 수 있도록 코틀린(Kotlin) 멀티플랫폼에 대한 최고 수준의 지원을 제공
87. 리사이즈블 에뮬레이터(Resizable Emulator), 컴팩트 UI 체크 모드(Compact UI Check Mode) 및 파이어베이스(Firebase) 기반 안드로이드 디바이스 스트리밍등 새로운 제품 출시
88. 크롬 126(Chrome 126)를 비롯해 크롬 데스크톱(Chrome Desktop)이용자들에게 기본 제공될 예정인 제미니 나노
89.사이트 아키텍처에 관계없이 앱과 같은 부드럽고 유연한 탐색 기능을 쉽게 구축할 수 있는 멀티페이지 앱 전용 보기 전환(View Transition) API
90. 누구나 사용 가능한 풀스택 멀티플랫폼 앱을 위한 새로운 통합 개발자 환경인 프로젝트 IDX 공개
91. 개발자가 앱 내 생성형 AI 경험을 더욱 쉽게 구축할 수 있도록 파이어베이스 젠키트(Firebase Genkit) 베타 버전 출시
92. 구글 클라우드 SQL(Google Cloud SQL)을 통해 파이어베이스에서 SQL을 사용할 수 있는 새로운 방법인 파이어베이스 데이터 커텍트(Firebase Data Connect)가 출시
책임감 있는 AI 발전
93.AI 기반 레드팀(AI-assisted red teaming)은 최첨단 기술을 통해 자체 시스템의 취약점을 사전에 테스트하고 이를 개선하는 검증 진행
https://blog.google/technology/ai/google-responsible-ai-commitment-update/
94. 신스ID(SynthID)를 텍스트와 동영상 두 가지 새로운 모달리티에도 확장
95. 신스ID 텍스트 워터마킹은 향후 몇 달 내에 업데이트된 책임감 있는 생성형 AI(Responsible Generative AI) 툴킷을 통해 오픈 소스화 예정
96. 제미나이를 기반으로 학습을 위해 미세 조정된 새로운 모델 제품군인 런LM 발표. 런LM은 이미 제미나이 검색, 유튜브, 구글 클래스룸 등 다양한 제품에서 기능들을 지원
97. 컬럼비아 사범대학(Columbia Teachers College), 애리조나 주립대(Arizona State University), NYU 티쉬(NYU Tisch), 칸 아카데미(Khan Academy)와 같은 기관의 전문가들과 협력하여 런LM을 개선하고 확장 예정
98. 또한 MIT RAISE팀과 협업하여 교육자가 교실에서 생성형 AI를 효과적으로 사용할 수 있도록 지원하는 온라인 강좌 개발
99. 지식에 대한 접근성과 이해도를 높이기 위해 만든 새로운 실험적 도구로 일루미네이트(Illuminate ) 개발
100. 일루미네이트는 단 몇 분 안에 두 개의 AI 생성 음성을 사용하여 대화를 생성하고 연구 논문의 주요 인사이트에 대한 개요를 제공. 신청은 labs.google
https://labs.google/
출처: https://blog.google/intl/ko-kr/products/google-io-2024-100-announcements-kr/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 5월 28일 오전 2:12