

5月29日,上海大模型独角兽阶跃星辰再次推出全新模型——Step 3.7 Flash正式发布并全面开源。距离上一代Step 3.5 Flash发布仅过去三个月,如此快速的基座模型迭代速度,令人印象深刻。
在大模型领域,“Flash”一词往往代表轻量化、高速响应与低成本。阶跃星辰接连两代基座模型均主推Flash版本,显然正在走一条与单纯增加参数规模截然不同的差异化发展路线。
据研发团队透露,Step 3.7 Flash专为生产级智能体应用场景而设计,旨在速度、成本、稳定执行以及复杂任务处理能力之间实现更优平衡。
在技术细节方面,该模型采用稀疏MoE(混合专家)架构,总参数量达1960亿,其中视觉模块参数为18亿,激活参数仅110亿,最高生成速度可达每秒400词元。这种架构设计尤其适用于高频、多轮交互的智能体应用场景,可显著提升任务执行效率。
相比之下,千问与DeepSeek的最新模型总参数超过1.6万亿,而Step 3.7 Flash的总参数量仅为前者的十分之一。但参数规模小并不代表能力不足。该代模型专门针对智能体核心需求,重点优化了多项关键能力——包括原生多模态理解与执行、联网与视觉搜索增强、高可靠性工具调用与编排,以及对智能体生态的兼容适配。可以说,以更小的模型规模实现了“以小博大”的高性价比效果。

权威基准测试的结果也印证了这一点:Step 3.7 Flash的性能与旗舰模型之间的差距并不显著。
当前,智能体正从演示阶段快速步入真实的企业生产环境,这对基础模型提出了全新要求——不仅需要追求峰值智能,更要在可规模化落地的场景中实现高效智能。换言之,模型不仅要能够回答问题,还必须理解复杂输入、主动检索信息、稳定调用工具,并在多轮长程任务中保持执行的一致性。
具体而言,Step 3.7 Flash能够直接处理用户界面、图表、文档、图片等多种应用,将复杂的视觉信息转化为结构化结果与可执行任务,并在信息不充分时主动发起搜索进行交叉验证。
在智能体生产级应用最核心的工具调用可靠性方面,Step 3.7 Flash进行了针对性优化。它能够在长程多轮工作流中稳定调用API、浏览器、终端、办公等各类工具,显著降低执行偏移和任务失败的风险。
基准测试结果显示,Step 3.7 Flash在多项复杂视觉任务评测中,展现出媲美更大规模旗舰模型的能力,尤其在多轮智能体工作流中的任务轨迹一致性方面表现十分突出。
此外,阶跃星辰还针对主流Agent框架与工具调用协议进行了兼容优化。该模型可稳定接入Claude Code、OpenClaw、Hermes Agent等主流编程与智能体工具,并支持云端及本地部署,有效降低了开发者的接入门槛与工作流编排成本。
随着各行各业加速推进智能体落地部署,Step 3.7 Flash的设计理念也折射出“Flash”版本模型角色的转变——它正在从单纯的轻量替代品,逐步演变为支撑生产级智能体规模化运行的基础设施。
