三星电子与谷歌云宣布将 Gemini 生成式 AI 引擎深度整合至家庭机器人 Ballie 系统,该设备搭载多模态推理技术,计划本季度末在北美及韩国市场开启多场景服务。双方技术路线图显示正构建跨终端生成式 AI 协作网络,混合现实设备开发已进入概念验证阶段。
谷歌将 Gemini Advanced 订阅专属的 AI 模型通过实验版本免费开放,该模型具备百万 token 上下文窗口与跨平台协作能力,底层算法优化推动企业级 AI 技术向大众市场渗透。
谷歌最新 AI 模型 Gemini 2.5 Pro 通过原生思维架构实现认知跃升,在 LMArena 和 GPQA 基准测试中刷新纪录。该模型支持百万级 token 上下文处理,并在 SWE-Bench 编程评估中以 63.8% 自主完成率创行业新高。
谷歌基于 Project Astra 项目的多模态架构研发出支持实时屏幕解析与环境感知的 AI 功能,通过分布式边缘计算架构实现隐私安全与毫秒级响应。该系统在屏幕内容解释、物体识别及动态追踪等场景展现 92% 准确率,推动增强现实与移动交互技术深度融合。
谷歌正在为其AI助手Gemini新增“视频生成”工具,通过简单的AI指令让用户轻松创作视频。该功能预计将与Gemini 2.0平台深度整合,进一步提升创作效率与灵活性。
谷歌推出Gemini 2.0 Flash,标志着其AI模型的重大升级,性能大幅超越前代,并首次支持生成图像与音频。该模型还增强了与第三方应用的整合,提升了AI在实际任务中的应用灵活性。
谷歌面向 Google Workspace 用户发布 Google Vids 应用,通过 Gemini 大模型,用户可轻松创建视频脚本、分镜头和幻灯片等内容。Vids 支持从素材查找到视频草稿自动生成,适用于客户支持、公司公告、员工培训、市场营销等场景。
TestingCatalog 报道称,谷歌即将推出 Gemini 2.0 版本,部分用户已开始进行测试,显示出响应速度的明显提升。然而,初步测试结果显示,Gemini 2.0 尚未完全成熟,未能通过简单的“草莓测试”。谷歌对此尚无回应,发布日期未定。
谷歌宣布向所有 Android 用户免费开放其语音 AI 聊天机器人 Gemini Live,此前仅限于 Gemini Advanced 用户。此举使谷歌在语音 AI 功能方面领先于 OpenAI,后者尚未全面推出类似功能。