开源创新
Browser-use作为AI驱动浏览器自动化的开源框架,通过融合DOM解析与视觉识别技术,实现自然语言指令操控网页交互。其双模态决策系统和异步架构支持复杂业务流程自动化,在电商、招聘等领域显著提升效率,GitHub开源生态加速技术迭代,获1700万美元融资印证商业潜力。
OpenAI正式发布首款AI浏览器ChatGPT Atlas,基于Chromium内核开发,现已在macOS上线。该产品通过自然语言交互、记忆系统和Agent模式重新定义浏览体验,同时面临隐私争议和市场挑战。
谷歌正在加紧推出新AI“Project Jarvis”,旨在接管用户的浏览器,处理日常任务,计划12月预览。这一代理将搭载即将发布的Gemini下一代模型,聚焦浏览器自动化,以缩短谷歌在AI领域与OpenAI的差距。