谷歌2024年I/O大会亮相：全新多模态Agent Astra和Gemini系列模型

谷歌在其2024年I/O大会上宣布了一系列创新技术，其中最受瞩目的是多模态Agent Astra和更新的Gemini系列模型。Astra能够理解其所处的环境并实时响应，这标志着谷歌AI技术的重大突破，能够更加深入地融入人们的日常生活。

大会上，谷歌CEO桑达尔·皮查伊强调，结合多模态能力和长文本处理，Astra能够处理更复杂的查询，并提供更为丰富的响应。Gemini 1.5 Pro模型的更新使其上下文窗口扩展至200万个token，使得处理大规模文档成为可能，而轻量级的Flash模型则提供了一种成本效益高的解决方案，每处理100万个token的成本仅为35美分。

在AI生成内容（AIGC）方面，谷歌推出了Imagen 3图像生成模型和Veo视频生成模型，后者能够产生超过60秒的高清视频。这些技术的推出展示了谷歌在AI领域的技术领先，预示着未来内容创建方式的重大变革。

安卓系统的更新也引人注目，新的全局搜索功能允许用户通过简单的界面操作即可搜索整个设备的内容。此外，谷歌搜索的升级包括了AI概述功能，新功能可以整合搜索结果，提供更为直观和组织化的信息展示。

谷歌此次发布的AI技术和产品的升级，体现了对AI第一战略的持续投入和创新。随着Astra和Gemini系列模型的应用，谷歌不仅在推动技术前沿，也在塑造未来人机交互的新方式。

谷歌2024年I/O大会亮相：全新多模态Agent Astra和Gemini系列模型

数智资讯订阅