谷歌推新AI代理“Project Jarvis”：12月亮相，应对OpenAI竞争

要点速达👈

🖥️ 谷歌将推出AI代理“Project Jarvis”，12月预览亮相。
💼 Jarvis将搭载新一代Gemini模型，专注浏览器操作自动化。
🆚 谷歌的AI代理功能定位追赶OpenAI和Anthropic同类产品。
⏳ 知情人士称Jarvis操作响应较慢，隐私与准确性成挑战。
🔒 安全性和数据隐私处理是谷歌Jarvis开发中的核心考量。

数智朋克消息，谷歌正在加速开发一款名为“Project Jarvis”的人工智能代理，计划在12月公开预览。该项目将利用AI技术来控制用户的浏览器，协助完成从产品购买到航班预订等日常任务。这款“计算机使用代理”将是谷歌对标OpenAI和Anthropic代理产品的尝试，尤其是在现有市场中提升谷歌对AI的控制力。多位知情人士透露，“Project Jarvis”项目的AI引擎将由谷歌即将发布的最新Gemini大型语言模型提供支持。

为追赶OpenAI，谷歌将Jarvis的适配重心放在Chrome浏览器上，这一定位也是AI代理开发的主要方向。分析认为，这一产品定位对标OpenAI的ChatGPT和Anthropic的同类产品，试图通过浏览器为用户完成信息收集等复杂任务。目前，谷歌在AI推理功能方面仍在加紧开发，而OpenAI已在9月推出了具备类似能力的升级版GPT。为了进一步提升开发效率，谷歌近期还将Gemini团队合并至DeepMind核心AI团队，加快产品开发步伐。

在AI领域，代理型系统被视为下一个重大趋势，这类系统可在较少人工干预的情况下执行用户指令，实现更多自动化。除OpenAI外，Salesforce、微软等公司也在应用大语言模型(LLMs)开发各自的AI代理解决方案。不同于Anthropic产品支持多个电脑应用程序，Jarvis目前的设计仅限于浏览器操作，主要集中在谷歌自家Chrome浏览器上，目标客户为追求网页操作自动化的用户。

谷歌“Project Jarvis”开发中的一项关键技术是通过频繁截取屏幕内容并分析，以自动执行用户操作。尽管与Anthropic产品相似，Jarvis在交互方式上具有明显差异：谷歌的代理主要针对浏览器自动化，采取了定制化优化，但Anthropic则在支持更多软件应用。

不过，这一AI代理的开发仍面临一定挑战。知情人士表示，Jarvis目前的响应速度较慢，需在每次执行前“思考”几秒钟。同时，由于执行任务需要访问客户的隐私数据，包括登录凭证和支付信息，数据隐私安全是产品投放的重要考量。此外，像其他LLMs一样，谷歌代理也可能产生错误答案，增加了产品在真实场景应用中的不确定性。

谷歌CEO Sundar Pichai曾在今年春季的开发者大会上透露，未来的Gemini版本可能在自动化方面会带来更多突破，包括帮助用户完成商品退换等实际操作，表明AI代理在自动执行任务的潜力。谷歌目前预计将向一小部分早期测试用户开放Jarvis，以便改进产品性能与安全性。

谷歌推新AI代理“Project Jarvis”：12月亮相，应对OpenAI竞争

数智资讯订阅