要点速达👈
- 🖥️ 谷歌将推出AI代理“Project Jarvis”,12月预览亮相。
- 💼 Jarvis将搭载新一代Gemini模型,专注浏览器操作自动化。
- 🆚 谷歌的AI代理功能定位追赶OpenAI和Anthropic同类产品。
- ⏳ 知情人士称Jarvis操作响应较慢,隐私与准确性成挑战。
- 🔒 安全性和数据隐私处理是谷歌Jarvis开发中的核心考量。
数智朋克消息,谷歌正在加速开发一款名为“Project Jarvis”的人工智能代理,计划在12月公开预览。该项目将利用AI技术来控制用户的浏览器,协助完成从产品购买到航班预订等日常任务。这款“计算机使用代理”将是谷歌对标OpenAI和Anthropic代理产品的尝试,尤其是在现有市场中提升谷歌对AI的控制力。多位知情人士透露,“Project Jarvis”项目的AI引擎将由谷歌即将发布的最新Gemini大型语言模型提供支持。
为追赶OpenAI,谷歌将Jarvis的适配重心放在Chrome浏览器上,这一定位也是AI代理开发的主要方向。分析认为,这一产品定位对标OpenAI的ChatGPT和Anthropic的同类产品,试图通过浏览器为用户完成信息收集等复杂任务。目前,谷歌在AI推理功能方面仍在加紧开发,而OpenAI已在9月推出了具备类似能力的升级版GPT。为了进一步提升开发效率,谷歌近期还将Gemini团队合并至DeepMind核心AI团队,加快产品开发步伐。
在AI领域,代理型系统被视为下一个重大趋势,这类系统可在较少人工干预的情况下执行用户指令,实现更多自动化。除OpenAI外,Salesforce、微软等公司也在应用大语言模型(LLMs)开发各自的AI代理解决方案。不同于Anthropic产品支持多个电脑应用程序,Jarvis目前的设计仅限于浏览器操作,主要集中在谷歌自家Chrome浏览器上,目标客户为追求网页操作自动化的用户。
谷歌“Project Jarvis”开发中的一项关键技术是通过频繁截取屏幕内容并分析,以自动执行用户操作。尽管与Anthropic产品相似,Jarvis在交互方式上具有明显差异:谷歌的代理主要针对浏览器自动化,采取了定制化优化,但Anthropic则在支持更多软件应用。
不过,这一AI代理的开发仍面临一定挑战。知情人士表示,Jarvis目前的响应速度较慢,需在每次执行前“思考”几秒钟。同时,由于执行任务需要访问客户的隐私数据,包括登录凭证和支付信息,数据隐私安全是产品投放的重要考量。此外,像其他LLMs一样,谷歌代理也可能产生错误答案,增加了产品在真实场景应用中的不确定性。
谷歌CEO Sundar Pichai曾在今年春季的开发者大会上透露,未来的Gemini版本可能在自动化方面会带来更多突破,包括帮助用户完成商品退换等实际操作,表明AI代理在自动执行任务的潜力。谷歌目前预计将向一小部分早期测试用户开放Jarvis,以便改进产品性能与安全性。