中国团队 Monica.im 通用型 AI 智能体 Manus 登顶 GAIA 基准测试以 92.3% 准确率重塑任务执行范式

核心要点👉

🚀 突破性三阶段协作机制实现92.3%基准测试准确率
💼 沙盒执行引擎支持Python/爬虫/办公软件多接口调用
📊 人力资源场景18分钟完成传统数天的市场调研
🌐 全球分发网络已在12个时区完成商业验证
💰 任务队列系统节省73%企业运营成本

数智朋克获悉，中国团队Monica.im在2025年春季推出的通用型AI智能体Manus，通过其突破性架构重新定义了人工智能的任务执行范式。这款运行于云端虚拟机的多智能体系统，采用规划、执行、验证三阶段协作机制，配合多模型联合驱动策略，成功将复杂任务拆解为可并行处理的子模块，在GAIA基准测试中以92.3%的准确率刷新三项难度级别记录，成为中国首个登顶该榜单的AI产品。

技术突破源于其独创的"沙盒执行引擎"，允许智能体在隔离环境中自由调用Python解释器、网络爬虫及办公软件接口。在人力资源场景演示中，该系统仅需用户上传压缩包，即可自动解析简历数据，结合企业需求生成带有匹配度评级的候选人清单，并同步输出可视化人才分布图谱。这种端到端的问题解决能力，使得传统需要数天完成的市场调研压缩至18分钟。

商业化进程中的实际案例显示，Manus在跨境电商业态中展现出独特价值。某品牌通过该平台自动抓取亚马逊评论数据，不仅生成情感分析报告，还能联动库存管理系统动态调整采购计划。教育领域用户仅输入教学目标，系统即可完成从课程设计、视频制作到习题生成的完整工作流，其输出的教学材料已通过多国教育机构认证。

资本市场对这款智能体的异步处理能力表现出强烈兴趣，其任务队列管理系统支持同时处理200+复杂指令的特性，为B端用户节省约73%的运营成本。值得关注的是，该产品依托Monica团队成熟的全球分发网络，初期测试阶段已在12个时区完成商业场景验证，这种跨地域适应性为其构建技术护城河提供了关键支撑。

中国团队 Monica.im 通用型 AI 智能体 Manus 登顶 GAIA 基准测试 以 92.3% 准确率重塑任务执行范式

数智资讯订阅

中国团队 Monica.im 通用型 AI 智能体 Manus 登顶 GAIA 基准测试以 92.3% 准确率重塑任务执行范式