游乐游手机版
首页/科技数码/文章详情

阶跃星辰多模态小核弹Step3-VL-10B开源

时间:2026-06-19 11:20
阶跃星辰开源Step3-VL-10B多模态大模型,包含Base和Thinking两个版本。仅10B参数,在视觉理解、逻辑推理等多项基准测试中超越参数大20倍的同类产品,甚至媲美顶尖闭源模型。其视觉感知、逻辑推理和端侧交互能力突出,支持SeRe和PaCoRe推理模式,可部署于端侧设备。

首先来看几个核心亮点:阶跃星辰正式开源了其 Step3-VL-10B 多模态大模型,并且一次性发布了 Base 和 Thinking 两个版本。最令人惊讶的是,这个仅有 10B 参数的小模型,在实际评测中表现竟然超越了参数规模大它 20 倍的同类产品。

官方对此明确表态:该模型在视觉理解、逻辑推理、数学竞赛解题、开放域对话等主流基准测试中,全部拿下了同参数量级的最佳成绩。换句话说,它彻底打破了“小模型等于低智能”的传统刻板印象。

具体来看,在好几项核心评测任务里,Step3-VL-10B 不仅追平了,甚至在某些场景下直接超越了参数多它 10 到 20 倍的开源旗舰模型——比如 GLM-4.6V 106B-A12B 和 Qwen3-VL-Thinking 235B-A22B。甚至能够与 Gemini 2.5 Pro、Seed-1.5-VL 这些顶尖闭源模型一较高下。

这一突破的意义在于:原本需要依赖云端服务器才能运行的高阶多模态推理能力,例如自动化操控手机界面、深度解析复杂文档、或者精确到毫米级的物体计数,现在都可以直接塞进智能手机、个人电脑,甚至是工业级的嵌入式设备里。

那么,这个“小而强”的模型究竟凭什么实现如此表现?从技术角度来看,它具备三大明确优势:

  • 强大的视觉感知能力。 在同等参数体量下,它的图像识别和场景感知精度达到了最高水平。关键是他们引入了一个叫 PaCoRe 的机制,全称是并行协调推理。这个机制让模型在处理复杂物体计数、超高精度 OCR、空间关系建模这些特别吃细节的任务时,稳定性和准确率都有了质的提升。
  • 长链条逻辑推理能力。 通过大规模强化学习不断优化训练路径,这个 10B 的模型居然也具备了跨领域的复杂推理能力。无论是解国际数学竞赛题、调试真实代码,还是做视觉逻辑谜题,它都能生成严密、可追溯的多步推理过程,并最终给出正确答案。
  • 实用的端侧交互能力。 基于海量的 GUI 场景数据预训练,模型能精准识别复杂的图形界面,理解语义并规划下一步动作。说白了,它就是一个轻量化端侧智能体的核心大脑。

值得一提的是,Step3-VL-10B 同时支持两种推理模式:SeRe 和 PaCoRe。从实测数据来看,在 STEM 推理、通用识别、OCR 与文档处理、GUI 定位、空间关系解析、代码生成这些关键维度上,它的表现已经可以媲美千亿参数的大模型。而且,PaCoRe 模式综合得分还要更高一筹。

来源:https://www.php.cn/faq/2009963.html?uid=1246273
上一篇小米直流变频落地扇1X升级版Type-C充电宝供电166元新低 下一篇国产首款全栈砺算LX7G100创始版今晚京东收官发售
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。