DIGIPUNK
去投稿
发表于:8 hours ago

北京人形机器人创新中心开源WoW具身世界模型,推动物理AI关键突破

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 开源突破:北京人形机器人创新中心全球开源WoW具身世界模型
  • 🧠 技术架构:融合视觉/动作/物理推理框架,含DiT/FM-IDM/SOPHIA核心组件
  • 📊 实测性能:简单任务精准度94.5%,中等任务成功率75.2%
  • 💡 开源生态:发布1.3B-14B参数模型及推理代码,降低行业研发门槛
  • 🌍 国际布局:特斯拉/Meta/宇树/智元等全球巨头加速世界模型赛道竞争

数智朋克讯,北京人形机器人创新中心近日向全球开源了WoW具身世界模型,标志着我国在物理人工智能领域取得关键突破。该模型通过融合视觉、动作与物理推理的统一框架,实现了从环境观察到因果理解的跨越式进化,其核心技术组件包括DiT世界生成基座模型FM-IDM逆动力学模型SOPHIA反思范式WoWBench评估基准。其中DiT系统从200万条交互轨迹中学习物理规律,FM-IDM实现视觉指令到机械运动的闭环转换,SOPHIA则模拟人类智能的迭代优化机制。

实测数据验证了该模型在复杂场景的卓越性能:驱动机械臂完成简单任务的精准度达94.5%,中等难度任务成功率突破75.2%,生成动作可直接部署至实体机器人。此次开源涵盖1.3B至14B参数的预训练模型及全套推理代码,大幅降低行业研发门槛。该技术已赋能抓取装配等工业场景,并具备数据自生成能力,为具身智能规模化落地提供核心支撑。

全球科技巨头正加速布局世界模型赛道,特斯拉的神经网络世界模型Meta的代码世界模型相继亮相,宇树科技UnifoLM架构智元Genie平台也展现国内技术储备。这类模型通过合成高保真物理数据,有效弥合仿真环境与真实世界的差异,目前超80%自动驾驶系统依赖其进行算法训练。北京创新中心同步推出具身天工2.0下肢系统与天轶2.0交互平台,构建慧思开物通用智能框架,在电力巡检、工业分拣等场景验证系统级应用能力。

尽管世界模型被视作物理AI的基石,东吴证券分析指出该技术仍处探索初期。创新中心通过开源运动控制框架、仿真数字资产等构建生态体系,累计提供10万条数据集并参与13项国标制定,推动行业避免低水平重复研发。随着斯坦福等学术机构引用其技术报告,中国在具身智能基础模型领域已跻身国际前沿阵营。

本文链接: https://www.shuzhipunk.com/articles/B8MHEm4xMS3
转载请注明文章出处

文章所属标签
具身世界模型
物理人工智能
机器人开源
世界模型技术
具身智能