核心要点👉
- 🚀 性能超越:SenseNova-SI以60.99平均分领先GPT-5(49.68)和Gemini 2.5 Pro(48.81)
- 🔧 突破短板:系统性训练方法解决AI空间认知缺陷,弥补行业不足
- 📊 训练范式:验证“尺度效应”在空间测量等六大维度实现一致性增强
- 🤖 应用场景:与“开悟”模型协同推动自动驾驶和机器人具身智能平台
- 🌐 开源生态:同步发布EASI测评平台及“英雄榜”加速产学研协同创新
数智朋克获悉,商汤科技近日宣布开源其SenseNova-SI系列模型,标志着空间智能领域的重要突破。这一多模态大模型在权威评测中展现出卓越性能,不仅领先于同量级开源解决方案如Qwen3-VL-8B和BAGEL-7B,还超越了闭源巨头GPT-5与Gemini 2.5 Pro的表现。空间智能作为AI理解三维世界的核心能力,长期被视为行业短板——例如,GPT-5虽能处理复杂图形推理,却在简单空间任务如俯视图选择中频频失误,而SenseNova-SI通过系统性训练方法有效弥补了这一缺陷。
评测数据显示,SenseNova-SI-8B在VSI、MMSI、MindCube及ViewSpatial等基准测试中平均得分达60.99,显著高于GPT-5的49.68和Gemini 2.5 Pro的48.81。性能提升源于商汤验证的“尺度效应”范式:依托大规模高质量空间数据训练,模型在空间测量、重构、关系、视角转换、形变与推理六大维度实现一致性增强。该训练方法具备通用性,可适配不同架构基模型如InternVL,为空间认知能力注入质的飞跃。
SenseNova-SI与商汤早前发布的“开悟”世界模型协同,旨在解决多模态AI从数字空间向物理世界迁移的挑战,推动具身智能平台“悟能”在自动驾驶和机器人场景的应用。同步开源的空间智能测评平台EASI及“英雄榜”,将统一评估标准,持续追踪模型进展,加速学术界与工业界的协同创新。这一进展为下一代通用人工智能融入现实环境奠定基础。







粤公网安备44030002001270号