核心要点👉
- 🚀 开源突破:北京人形机器人创新中心全球开源WoW具身世界模型
 - 🧠 技术架构:融合视觉/动作/物理推理框架,含DiT/FM-IDM/SOPHIA核心组件
 - 📊 实测性能:简单任务精准度94.5%,中等任务成功率75.2%
 - 💡 开源生态:发布1.3B-14B参数模型及推理代码,降低行业研发门槛
 - 🌍 国际布局:特斯拉/Meta/宇树/智元等全球巨头加速世界模型赛道竞争
 
数智朋克讯,北京人形机器人创新中心近日向全球开源了WoW具身世界模型,标志着我国在物理人工智能领域取得关键突破。该模型通过融合视觉、动作与物理推理的统一框架,实现了从环境观察到因果理解的跨越式进化,其核心技术组件包括DiT世界生成基座模型、FM-IDM逆动力学模型、SOPHIA反思范式及WoWBench评估基准。其中DiT系统从200万条交互轨迹中学习物理规律,FM-IDM实现视觉指令到机械运动的闭环转换,SOPHIA则模拟人类智能的迭代优化机制。
实测数据验证了该模型在复杂场景的卓越性能:驱动机械臂完成简单任务的精准度达94.5%,中等难度任务成功率突破75.2%,生成动作可直接部署至实体机器人。此次开源涵盖1.3B至14B参数的预训练模型及全套推理代码,大幅降低行业研发门槛。该技术已赋能抓取装配等工业场景,并具备数据自生成能力,为具身智能规模化落地提供核心支撑。
全球科技巨头正加速布局世界模型赛道,特斯拉的神经网络世界模型、Meta的代码世界模型相继亮相,宇树科技UnifoLM架构与智元Genie平台也展现国内技术储备。这类模型通过合成高保真物理数据,有效弥合仿真环境与真实世界的差异,目前超80%自动驾驶系统依赖其进行算法训练。北京创新中心同步推出具身天工2.0下肢系统与天轶2.0交互平台,构建慧思开物通用智能框架,在电力巡检、工业分拣等场景验证系统级应用能力。
尽管世界模型被视作物理AI的基石,东吴证券分析指出该技术仍处探索初期。创新中心通过开源运动控制框架、仿真数字资产等构建生态体系,累计提供10万条数据集并参与13项国标制定,推动行业避免低水平重复研发。随着斯坦福等学术机构引用其技术报告,中国在具身智能基础模型领域已跻身国际前沿阵营。







 粤公网安备44030002001270号