商汤发布SenseNova-SI模型:空间智能超越GPT-5
商汤科技近日公布,正式推出并开源其全新空间智能大模型系列SenseNova-SI,在空间理解与推理能力方向实现重大突破。该系列模型在多项权威基准测试中表现优异,不仅显著超越同量级开源多模态模型,更在空间智能任务上领先于GPT-5、Gemini 2.5 Pro等国际顶尖闭源模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
尽管当前主流大模型在知识问答、文本生成、逻辑推理等领域表现突出,但在处理空间结构信息时仍存在明显短板。这种能力缺陷直接限制了具身智能体与物理世界交互的效率,例如机器人导航、自动驾驶等场景都需要精准的空间感知能力。商汤科技此次发布的成果,正是针对这一行业痛点展开的技术攻关。
开源的SenseNova-SI系列包含2B和8B两种参数规模的模型版本。根据最新披露的评测数据,在VSI、MMSI、MindCube、ViewSpatial等空间智能专项测试中,该系列模型均取得领先成绩。其中8B版本在四个核心基准测试中平均得分达60.99,较Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源模型提升显著,甚至超越了参数规模更大的GPT-5(49.68)和Gemini 2.5 Pro(48.81)。
具体案例对比显示,在立方体组合图形的俯视图识别任务中,SenseNova-SI-8B准确选择正确答案B,而GPT-5误选D;在空间方位判断场景中,面对"手持相机者视角下摩托车位置"的问题,SenseNova-SI-8B正确识别右侧位置,GPT-5则给出错误答案。更复杂的动态场景测试中,该模型在多车道车辆转向预测、视角变化下的移动方向判断等任务中,均展现出更高的准确率。
技术团队通过创新的空间表征学习框架,使模型能够高效解析几何关系、物体方位及动态轨迹等复杂空间信息。这种突破性进展不仅体现在静态场景理解,更延伸至动态环境预测领域。例如在自动驾驶场景测试中,SenseNova-SI-8B成功识别黄色车辆的右转意图,而GPT-5误判为静止状态。
该系列模型已通过GitHub平台全面开源,开发人员可访问指定地址获取完整代码与训练数据集。此举将为空间智能领域的研究提供重要基础设施,推动机器人导航、增强现实、智能驾驶等应用场景的技术创新。商汤科技表示,将持续优化模型性能,并探索与三维重建、物理仿真等技术的融合应用。
热门专题
热门推荐
现货网格交易终极指南:在币安高效捕捉震荡行情利润 在加密货币市场,震荡行情占据了大部分交易时间。对于希望实现自动化套利的交易者而言,现货网格交易无疑是一种高效策略。本文将为您提供一份详尽的币安网格交易设置教程,从币对选择到风控配置,手把手教您搭建一个稳健的自动化交易系统,旨在提升资金利用效率,在波动
如何用 Object getOwnPropertyDescriptors 完美克隆包含 Getter Setter 的复杂对象 Object getOwnPropertyDescriptors 为什么能拿到 getter setter 许多开发者存在一个普遍的误解,认为 Object assign
Flowlu 2 0是什么 如果说管理一家公司时,手边需要同时打开十几个软件窗口,那效率恐怕会大打折扣。而Flowlu 2 0要解决的,正是这个痛点。它本质上是一款All-In-One的全能型业务管理平台,由Flowlu团队精心打造。其目标很明确:帮助公司将散落在各处的运营环节——无论是项目管理、客
永续合约新手完全指南:从零基础到安全实战 在Web3的金融衍生品世界中,永续合约以其无到期日和高资金效率的特点,成为众多交易者的核心工具。然而,其独特的机制也伴随着显著风险。对于新手而言,透彻理解其运作原理并建立严格的风控体系,是迈向成功交易的第一步。本文将深入解析永续合约的核心机制,并提供一套完整
Debian安全态势深度解析:漏洞趋势与实战防护全攻略 在开源操作系统领域,Debian以其卓越的稳定性和公认的安全性,成为全球服务器与桌面环境的优先选择。然而,随着其应用规模的持续扩大,系统面临的安全威胁也日趋复杂与多样化。对于系统管理员和运维人员而言,深入理解Debian的漏洞利用现状与演变趋势





