上海基座模型再升级，参数仅为DeepSeek十分之一，能力如何以小博大？

时间：2026-05-31 09:59

5月29日，上海大模型独角兽阶跃星辰再次推出全新模型——Step 3 7 Flash正式发布并全面开源。距离上一代Step 3 5 Flash发布仅过去三个月，如此快速的基座模型迭代速度，令人印象深刻。在大模型领域，“Flash”一词往往代表轻量化、高速响应与低成本。阶跃星辰接连两代基座模型均主推

5月29日，上海大模型独角兽阶跃星辰再次推出全新模型——Step 3.7 Flash正式发布并全面开源。距离上一代Step 3.5 Flash发布仅过去三个月，如此快速的基座模型迭代速度，令人印象深刻。

在大模型领域，“Flash”一词往往代表轻量化、高速响应与低成本。阶跃星辰接连两代基座模型均主推Flash版本，显然正在走一条与单纯增加参数规模截然不同的差异化发展路线。

据研发团队透露，Step 3.7 Flash专为生产级智能体应用场景而设计，旨在速度、成本、稳定执行以及复杂任务处理能力之间实现更优平衡。

在技术细节方面，该模型采用稀疏MoE（混合专家）架构，总参数量达1960亿，其中视觉模块参数为18亿，激活参数仅110亿，最高生成速度可达每秒400词元。这种架构设计尤其适用于高频、多轮交互的智能体应用场景，可显著提升任务执行效率。

相比之下，千问与DeepSeek的最新模型总参数超过1.6万亿，而Step 3.7 Flash的总参数量仅为前者的十分之一。但参数规模小并不代表能力不足。该代模型专门针对智能体核心需求，重点优化了多项关键能力——包括原生多模态理解与执行、联网与视觉搜索增强、高可靠性工具调用与编排，以及对智能体生态的兼容适配。可以说，以更小的模型规模实现了“以小博大”的高性价比效果。

权威基准测试的结果也印证了这一点：Step 3.7 Flash的性能与旗舰模型之间的差距并不显著。

当前，智能体正从演示阶段快速步入真实的企业生产环境，这对基础模型提出了全新要求——不仅需要追求峰值智能，更要在可规模化落地的场景中实现高效智能。换言之，模型不仅要能够回答问题，还必须理解复杂输入、主动检索信息、稳定调用工具，并在多轮长程任务中保持执行的一致性。

具体而言，Step 3.7 Flash能够直接处理用户界面、图表、文档、图片等多种应用，将复杂的视觉信息转化为结构化结果与可执行任务，并在信息不充分时主动发起搜索进行交叉验证。

在智能体生产级应用最核心的工具调用可靠性方面，Step 3.7 Flash进行了针对性优化。它能够在长程多轮工作流中稳定调用API、浏览器、终端、办公等各类工具，显著降低执行偏移和任务失败的风险。

基准测试结果显示，Step 3.7 Flash在多项复杂视觉任务评测中，展现出媲美更大规模旗舰模型的能力，尤其在多轮智能体工作流中的任务轨迹一致性方面表现十分突出。

此外，阶跃星辰还针对主流Agent框架与工具调用协议进行了兼容优化。该模型可稳定接入Claude Code、OpenClaw、Hermes Agent等主流编程与智能体工具，并支持云端及本地部署，有效降低了开发者的接入门槛与工作流编排成本。

随着各行各业加速推进智能体落地部署，Step 3.7 Flash的设计理念也折射出“Flash”版本模型角色的转变——它正在从单纯的轻量替代品，逐步演变为支撑生产级智能体规模化运行的基础设施。

来源：https://www.163.com/dy/article/KU4G1PCG055040N3.html

上一篇神舟二十二号载人飞船返回舱顺利完成着陆任务 下一篇钟睒睒5亿注资智邦锂电布局固态电池再掀波澜

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时，同比增长5 0%。充换电服务业用电增速高达48 8%，信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市联体风扇售价429元

追风者冰川360S25液冷散热器售价429元，三联一体风扇便捷安装，冷头小体积纯铜底座噪音18dB，风扇转速300-2000RPM、风量75CFM、静压2 96mmAq，五年质保漏液包赔。

科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映，GooglePlayServices后台耗电异常，电量占比最高达99 97%，远超正常水平，严重影响续航。目前故障原因不明，谷歌尚未发布官方声明。

科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足盼新CEO改进

罗永浩批评苹果iOS27创新不足，称仅有双iPhone同号、音量分离等数十项细节改进，认为库克时代缺乏突破性创新，股市虽好但消费者只能被迫接受挤牙膏式升级。

科技数码 · 2026-06-29

年国产车出口710万辆，两家车企销量破百万

2025年国产汽车出口总量达710万辆，同比增长21%。奇瑞以134万辆居首，比亚迪105万辆次之，上汽乘用车出口占比60%最高，长城出口51万辆。吉利、长安等主流品牌同步增长，小鹏、零跑等新兴品牌海外拓展加速。