游乐游手机版
首页/科技数码/文章详情

商汤开源Mars模型:让AI具备真实“执行力”

时间:2026-01-30 13:07
IT之家 1 月 30 日消息,1 月 29 日,商汤宣布开源多模态自主推理模型 SenseNova-MARS(8B 32B 双版本)。据商汤介绍,该模型是首个支持动态视觉推理和图文搜索深度融合的

据IT之家最新消息,商汤于1月29日正式开源了全新的多模态自主推理模型SenseNova-MARS,并提供8B及32B两个版本。官方介绍称,该模型是业内首个将动态视觉推理与图文搜索深度整合的Agentic VLM模型。

以下为相关资源地址:

Github 仓库

模型仓库

32B版本 8B版本

测试数据显示,SenseNova-MARS在多模态搜索与推理的核心基准评测中获得了69.74分,表现超越了Gemini-3-Pro的69.06分以及GPT-5.2的67.64分。

作为首个深度整合动态视觉推理与图文搜索能力的Agentic VLM模型,SenseNova-MARS能够自主规划任务步骤,调用各类工具,轻松处理各种复杂场景。它让AI真正具备了“执行力”,成为更可靠的任务助手。

在MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等一系列标准测试中,SenseNova-MARS均取得了开源模型中的最优成绩,其表现甚至超越了Gemini-3.0-Pro、GPT-5.2等顶级闭源模型。

为了让大家更直观地了解它的实际应用,我们整理了几个典型的使用案例。

面对一个需要同时识别赛车服上微小logo、查询公司成立年份、匹配车手出生年月并计算差值的复杂任务时,SenseNova-MARS可以自主调用图像裁剪、文本/图像搜索工具,无需人工干预即可完成闭环推理。


从产品发布会或行业峰会的现场照片中,SenseNova-MARS能够识别企业的标识,快速搜集相关产品、公司背景信息,以及时间、数量、参数等具体细节,辅助分析行业现状与竞争格局。


根据赛事照片,模型可识别画面中的品牌logo、人物等信息,追溯比赛进程或个人背景,帮助用户快速补充遗漏的关键细节。


模型还能轻松处理步骤超长的多模态推理任务,支持超过三种工具的调用。它可以自动裁剪并分析图像细节,搜索相关研究数据,快速验证假设,最终得出关键判断。


总而言之,SenseNova-MARS能够自动解决“细节识别+信息检索+逻辑推理”的复杂链条任务,有效帮助提升工作效率。

图像裁剪功能:能精准聚焦图片上的微小细节,即便其占比不到5%——例如赛车手服装上的微型logo、赛事照片里观众席上的标语,都能通过裁剪放大进行清晰分析。图像搜索功能:能在看到物体、人物或场景的瞬间自动匹配相关信息——比如识别出赛车手的身份,或是某款冷门设备的具体型号。文本搜索功能:能快速抓取精准信息——无论是公司成立年份、人物出生年月,还是最新的行业数据,都能秒级获取。

来源:https://www.163.com/dy/article/KKH3LEJF0511B8LM.html
上一篇伯翱智能港股9个月营收3亿仍亏5867万,反超比亚迪股东? 下一篇Win11开年补丁问题频发:黑屏与显卡罢工如何解决?
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5