大模型之家讯 日前,商汤科技宣布旗下多模态模型体系“日日新”在空间智能方向取得新进展,正式发布并开源 SenseNova-SI 系列。据公开评测结果显示,该系列在多项空间理解与推理任务上取得领先表现,不仅超过同量级的开源模型,还在部分指标上超越 GPT-5 与 Gemini 2.5 Pro 等闭源产品。
补齐空间智能短板:行业普遍难题浮现

尽管当下大模型在语言、推理、代码等任务持续突破,但在三维结构理解与空间推理方面仍存在明显不足。这一短板直接制约了其向具身智能落地的能力。业内普遍认为,若无法准确理解真实环境中的对象关系、视角变化与动态信息,AI在机器人、自动驾驶等物理场景中的应用将难以进一步规模化。
商汤方面表示,SenseNova-SI 的推出正是希望从基础能力上改善模型对世界的空间认知水平,使其能够真正“看懂”三维世界。
评测结果显示能力提升已具规模效应
此次开源的 SenseNova-SI 包含 2B 与 8B 两个模型规格。GitHub 公布的评测数据显示,在 VSI、MMSI、MindCube、ViewSpatial 等基准中,SenseNova-SI-8B 的平均成绩达到 60.99。对比结果显示,该成绩显著领先 Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等同量级开源多模态模型,同时也超过了 SpatialMLLM、ViLaSR-7B 等专注空间智能的模型。

值得关注的是,在相对轻量规模下,SenseNova-SI-8B 在部分空间任务中也超过了 GPT-5(49.68)、Gemini-2.5-Pro(48.81)等闭源产品。业内人士认为,这意味着模型在空间认知方面出现了质变,而非单纯依靠算力堆砌的参数规模扩张。
商汤方面介绍,这一提升得益于其提出的空间能力分类体系及持续扩展的数据规模训练策略,并首次在空间智能领域验证了“尺度效应”。该方法具备通用性,可用于增强不同架构基模型在空间测量、重构、关系理解、视角转换、形变推理等能力。详细技术方案将在后续技术报告中披露。
面向具身智能应用,驱动生态与评测体系共发展
空间智能被视为世界模型与具身智能的核心基础。今年 7 月,商汤推出“悟能”具身智能平台,以其“开悟”世界模型为核心。此次发布的 SenseNova-SI 将与该平台协同,为机器人与智能设备提供更加可靠的环境理解能力。
与此同时,商汤同步开源了空间智能测评平台 EASI 及配套“英雄榜”,用于统一评测指标、实时展示模型进展,希望推动学界与产业界在空间智能方向的协同创新。
业内普遍认为,SenseNova-SI 的发布在空间理解方向释放了新的技术信号,对下一代通用人工智能走向物理世界具有一定的推动作用,也为具身智能落地奠定了新的基础。
原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/13498