DIGIPUNK
去投稿
发表于:2025年11月12日

商汤开源空间智能大模型SenseNova-SI,评测性能超越GPT-5与Gemini 2.5 Pro

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 性能超越:SenseNova-SI以60.99平均分领先GPT-5(49.68)和Gemini 2.5 Pro(48.81)
  • 🔧 突破短板:系统性训练方法解决AI空间认知缺陷,弥补行业不足
  • 📊 训练范式:验证“尺度效应”在空间测量等六大维度实现一致性增强
  • 🤖 应用场景:与“开悟”模型协同推动自动驾驶和机器人具身智能平台
  • 🌐 开源生态:同步发布EASI测评平台及“英雄榜”加速产学研协同创新

数智朋克获悉,商汤科技近日宣布开源其SenseNova-SI系列模型,标志着空间智能领域的重要突破。这一多模态大模型在权威评测中展现出卓越性能,不仅领先于同量级开源解决方案如Qwen3-VL-8B和BAGEL-7B,还超越了闭源巨头GPT-5与Gemini 2.5 Pro的表现。空间智能作为AI理解三维世界的核心能力,长期被视为行业短板——例如,GPT-5虽能处理复杂图形推理,却在简单空间任务如俯视图选择中频频失误,而SenseNova-SI通过系统性训练方法有效弥补了这一缺陷

评测数据显示,SenseNova-SI-8B在VSI、MMSI、MindCube及ViewSpatial等基准测试中平均得分达60.99,显著高于GPT-5的49.68和Gemini 2.5 Pro的48.81性能提升源于商汤验证的“尺度效应”范式:依托大规模高质量空间数据训练,模型在空间测量、重构、关系、视角转换、形变与推理六大维度实现一致性增强。该训练方法具备通用性,可适配不同架构基模型如InternVL,为空间认知能力注入质的飞跃。

SenseNova-SI与商汤早前发布的“开悟”世界模型协同,旨在解决多模态AI从数字空间向物理世界迁移的挑战,推动具身智能平台“悟能”在自动驾驶和机器人场景的应用。同步开源的空间智能测评平台EASI及“英雄榜”,将统一评估标准,持续追踪模型进展,加速学术界与工业界的协同创新。这一进展为下一代通用人工智能融入现实环境奠定基础。

本文链接: https://www.shuzhipunk.com/articles/poaIVcIQ0zF
转载请注明文章出处

文章所属标签
空间智能
多模态大模型
SenseNova-SI
尺度效应
具身智能