全球权威大模型评测平台Artificial Analysis(AA)最新发布的Output Speed榜单中,阶跃星辰推出的开源基座模型Step 3.7 Flash以409 Tokens/s的输出速度,一举登顶主流模型速度榜首。不仅如此,该模型在端到端响应时长、智能效率与速度价格比的综合平衡上也表现抢眼,实现了“多赛道领先”的突破性成绩。
【相关阅读】阶跃发布并开源Step 3.7 Flash,“多快好省”拉高模型效率上限

上图对比模型均为Artificial Analysis最新默认选项

此图中Step 3.7 Flash仅与同量级的其他主流Flash模型进行比较

上图对比模型同样为Artificial Analysis最新默认选项
细看Step 3.7 Flash的研发策略,延续了上一代Step 3.5 Flash的核心理念:不追求单一指标的极致,而是聚焦“效率上限”——强调实用性,在推理速度、性能表现与成本效益之间寻求最优平衡,同时支持本地部署。3.7版本在此基础之上更进一步,将多维度能力的协同效率纳入考量框架,使得成本控制、运行稳定性及部署灵活性更能支撑长期高频场景。
这背后折射出行业大趋势:大模型的竞争焦点正从“单点能力”向“Agent真实任务效率”转移。在信息浏览、内容检索、文档理解、界面分析以及工具调用等完整任务链路中,模型不再仅仅是问答机器人,而是充当持续运行的任务引擎。端到端时延、吞吐能力以及成本结构,已经成为真正的核心约束。换言之,谁能系统性地在高吞吐、低时延与成本效率之间取得平衡,谁就能在Agent规模化落地的赛道上抢占先机。
从这个维度来看,Step 3.7 Flash在智能效率比、端到端响应时长、速度价格比等多个维度领先同档位模型绝非偶然。它实现了智能、速度与成本的协同优化,对于高频调用、持续运行、可规模化部署的Agent系统而言,这构成了基础能力支撑。这一表现也印证了一个判断:Agent时代的核心竞争力,已经从“模型能力峰值”转向了“真实任务完成效率”,本质上是速度、智能与成本之间的系统性平衡。
开发者社区的反馈同样具有说服力。Step 3.7 Flash发布后迅速攀升至OpenRouter Trending全球第二位,成为近期全球开发者社区关注度最高的开源模型之一。从实测反馈看,该模型在运行效率、多模态理解以及Agent工具调用能力方面表现出色。

综合来看,Step 3.7 Flash在权威评测榜单与开发者社区中的双重优异表现,一方面验证了高吞吐与低时延的工程实力,另一方面也表明中国开源模型正在加速融入全球开发者生态,并在下一阶段Agent基础设施竞争中占据越来越关键的位置。
原标题:《阶跃Step 3.7 Flash登顶AA榜:端到端响应、性价比等多项领跑》
栏目编辑:陆梓华
