首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
商汤开源Mars模型:让AI具备真实“执行力”

商汤开源Mars模型:让AI具备真实“执行力”

热心网友
45
转载
2026-01-30

据IT之家最新消息,商汤于1月29日正式开源了全新的多模态自主推理模型SenseNova-MARS,并提供8B及32B两个版本。官方介绍称,该模型是业内首个将动态视觉推理与图文搜索深度整合的Agentic VLM模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

以下为相关资源地址:

Github 仓库

模型仓库

32B版本 8B版本

测试数据显示,SenseNova-MARS在多模态搜索与推理的核心基准评测中获得了69.74分,表现超越了Gemini-3-Pro的69.06分以及GPT-5.2的67.64分。

作为首个深度整合动态视觉推理与图文搜索能力的Agentic VLM模型,SenseNova-MARS能够自主规划任务步骤,调用各类工具,轻松处理各种复杂场景。它让AI真正具备了“执行力”,成为更可靠的任务助手。

在MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等一系列标准测试中,SenseNova-MARS均取得了开源模型中的最优成绩,其表现甚至超越了Gemini-3.0-Pro、GPT-5.2等顶级闭源模型。

为了让大家更直观地了解它的实际应用,我们整理了几个典型的使用案例。

面对一个需要同时识别赛车服上微小logo、查询公司成立年份、匹配车手出生年月并计算差值的复杂任务时,SenseNova-MARS可以自主调用图像裁剪、文本/图像搜索工具,无需人工干预即可完成闭环推理。


从产品发布会或行业峰会的现场照片中,SenseNova-MARS能够识别企业的标识,快速搜集相关产品、公司背景信息,以及时间、数量、参数等具体细节,辅助分析行业现状与竞争格局。


根据赛事照片,模型可识别画面中的品牌logo、人物等信息,追溯比赛进程或个人背景,帮助用户快速补充遗漏的关键细节。


模型还能轻松处理步骤超长的多模态推理任务,支持超过三种工具的调用。它可以自动裁剪并分析图像细节,搜索相关研究数据,快速验证假设,最终得出关键判断。


总而言之,SenseNova-MARS能够自动解决“细节识别+信息检索+逻辑推理”的复杂链条任务,有效帮助提升工作效率。

图像裁剪功能:能精准聚焦图片上的微小细节,即便其占比不到5%——例如赛车手服装上的微型logo、赛事照片里观众席上的标语,都能通过裁剪放大进行清晰分析。图像搜索功能:能在看到物体、人物或场景的瞬间自动匹配相关信息——比如识别出赛车手的身份,或是某款冷门设备的具体型号。文本搜索功能:能快速抓取精准信息——无论是公司成立年份、人物出生年月,还是最新的行业数据,都能秒级获取。

来源:https://www.163.com/dy/article/KKH3LEJF0511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

从“摸黑探索”到“撞开大门”,OpenClaw引爆的产业技术路线演变
科技数码
从“摸黑探索”到“撞开大门”,OpenClaw引爆的产业技术路线演变

从“动口”到“动手”:OpenClaw如何将AI推入“执行时代”? 文|洞见新研社 3月的最后一周,OpenClaw的GitHub社区上演了一出反转剧。往日里忙着报错的开发者们这次成了观众,主角换成了来自蚂蚁、天融信、360等机构的安全研究员,他们密集披露了数十个涉及远程接管、信息泄露的高风险漏洞。

热心网友
04.22
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时额度翻倍
业界动态
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时额度翻倍

程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时10倍额度 北京时间4月10日凌晨,OpenAI终于落下了重度用户期盼已久的那只靴子:正式推出每月100美元的全新订阅方案。 至此,OpenAI的商业化版图已经清晰地划分为四个核心层级: ·免费版(接入广告) ·每月8美元的G

热心网友
04.22
国内首款“养虾本”来了
科技数码
国内首款“养虾本”来了

2026 04 14 一个核心趋势是:未来的商业竞争,本质上是用户注意力资源的争夺战。谁能更精准、高效地连接信息与用户需求,谁就能在市场中赢得关键优势。 本文配图深刻揭示了这种高效连接的底层逻辑与完整工作流。它系统展示了从数据采集到价值交付的闭环链路,每个环节都紧密耦合。实践证明,其中任一节点的效率

热心网友
04.14
Token经济崛起:迅策(03317)有望跻身AI“千亿俱乐部”
科技数码
Token经济崛起:迅策(03317)有望跻身AI“千亿俱乐部”

AI行业迎来关键转折:从“烧钱补贴”迈入“商业化定价”新阶段。被市场誉为“Token第一股”的迅策科技(03317)迎来重大利好。近期,国泰君安国际大幅上调其目标价至245港元 股。多重因素驱动下,迅策有望成为AI领域“千亿市值俱乐部”的有力竞争者。 中国AI实现弯道超车:成本优势构筑核心壁垒 全球

热心网友
04.14
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话
AI
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

红色沙漠星之塔怎么进入
游戏攻略
红色沙漠星之塔怎么进入

红色沙漠星之塔怎么进入 好消息是,星之塔的进入方式非常直接,它会在主线流程中自动解锁,你完全不需要提前满世界探索或者寻找隐藏入口。 当你跟随主线指引,到达星之塔所在的那片区域后,抬头就能看到它矗立在山顶。接下来要做的很简单:沿着图中这条醒目的红色路线所示的楼梯,一路向上攀登,就能直达山顶的星之塔正门

热心网友
04.26
王者荣耀姑射山王者荣耀世界观中的神秘仙山场景
游戏攻略
王者荣耀姑射山王者荣耀世界观中的神秘仙山场景

《王者荣耀世界》即将正式与玩家见面 备受期待的开放世界RPG手游《王者荣耀世界》,已经进入了上线前的最后阶段。官方释放的大量前瞻信息中,地图设计与剧情体验无疑是两大核心亮点。而作为游戏首赛季(S1)的重头戏,全新区域“姑射山”的登场,显然不仅仅是添一张新地图那么简单。它被深度植入了原创剧情,旨在为玩

热心网友
04.26
红色沙漠动力核心怎么获得
游戏攻略
红色沙漠动力核心怎么获得

红色沙漠动力核心怎么获得 想拿到动力核心,目标很明确:找到那些固定刷新的阿比斯守卫。它们常在一些特定地点徘徊,比如坍塌城门区域的悬崖边上,就是不错的狩猎场。 找到目标后先别急着动手,这里有个关键步骤能省下大量时间:在开打前,务必手动保存一下游戏。这相当于给自己买了一份“保险”,万一守卫没掉你想要的东

热心网友
04.26
王者荣耀世界元流之子王者荣耀元流之子射手技能解析与实战应用
游戏攻略
王者荣耀世界元流之子王者荣耀元流之子射手技能解析与实战应用

《王者荣耀世界》已正式官宣将于2026年4月上线 千呼万唤始出来,腾讯天美工作室的开放世界MMOARPG《王者荣耀世界》,终于敲定了2026年4月的上线日期。消息一出,玩家社区的讨论热度再次被点燃。在众多引人注目的首发角色里,“元流之子”以其鲜明的定位和独特的技能设计,成为焦点中的焦点。最近,不少玩

热心网友
04.26
王者荣耀世界角色获取攻略王者荣耀世界角色怎么获得全解析
游戏攻略
王者荣耀世界角色获取攻略王者荣耀世界角色怎么获得全解析

《王者荣耀世界》英雄获取全指南:三种核心方式,快速组建强力阵容 在《王者荣耀世界》的开放世界中开启冒险之旅,作为“元流之子”的你,最令人期待的体验莫过于招募那些熟悉与全新的英雄伙伴。无论是伽罗、东方曜等经典角色,还是“冷春”这样的原创人物,他们的独特故事与强大技能,共同构成了这个东方幻想世界的核心吸

热心网友
04.26