商汤开源空间智能大模型SenseNova-SI，评测性能超越GPT-5与Gemini 2.5 Pro

核心要点👉

🚀 性能超越：SenseNova-SI以60.99平均分领先GPT-5(49.68)和Gemini 2.5 Pro(48.81)
🔧 突破短板：系统性训练方法解决AI空间认知缺陷，弥补行业不足
📊 训练范式：验证“尺度效应”在空间测量等六大维度实现一致性增强
🤖 应用场景：与“开悟”模型协同推动自动驾驶和机器人具身智能平台
🌐 开源生态：同步发布EASI测评平台及“英雄榜”加速产学研协同创新

数智朋克获悉，商汤科技近日宣布开源其SenseNova-SI系列模型，标志着空间智能领域的重要突破。这一多模态大模型在权威评测中展现出卓越性能，不仅领先于同量级开源解决方案如Qwen3-VL-8B和BAGEL-7B，还超越了闭源巨头GPT-5与Gemini 2.5 Pro的表现。空间智能作为AI理解三维世界的核心能力，长期被视为行业短板——例如，GPT-5虽能处理复杂图形推理，却在简单空间任务如俯视图选择中频频失误，而SenseNova-SI通过系统性训练方法有效弥补了这一缺陷。

评测数据显示，SenseNova-SI-8B在VSI、MMSI、MindCube及ViewSpatial等基准测试中平均得分达60.99，显著高于GPT-5的49.68和Gemini 2.5 Pro的48.81。性能提升源于商汤验证的“尺度效应”范式：依托大规模高质量空间数据训练，模型在空间测量、重构、关系、视角转换、形变与推理六大维度实现一致性增强。该训练方法具备通用性，可适配不同架构基模型如InternVL，为空间认知能力注入质的飞跃。

SenseNova-SI与商汤早前发布的“开悟”世界模型协同，旨在解决多模态AI从数字空间向物理世界迁移的挑战，推动具身智能平台“悟能”在自动驾驶和机器人场景的应用。同步开源的空间智能测评平台EASI及“英雄榜”，将统一评估标准，持续追踪模型进展，加速学术界与工业界的协同创新。这一进展为下一代通用人工智能融入现实环境奠定基础。

商汤开源空间智能大模型SenseNova-SI，评测性能超越GPT-5与Gemini 2.5 Pro

数智资讯订阅