2026年5月29日,阶跃星辰正式推出新一代高效率Flash模型——Step 3.7 Flash。如果说之前的模型更偏向单向的问答交互,那么这一次,Step 3.7 Flash的核心突破显然在于“理解之后主动执行”。它不再满足于给出答案,而是在多模态感知、网页与视觉搜索、工具调用、代码执行以及完整的Agent工作流方面,完成了一套系统性的能力升级。
从技术架构来看,Step 3.7 Flash采用稀疏MoE视觉语言模型,将文本、图像、代码、搜索和工具调用能力深度融合在一起。官方信息显示,它能够理解产品界面、文档、图表以及各类自然场景中的视觉输入,并基于所看到的内容生成代码或调用工具完成任务。对于AI Agent而言,这意味着模型不再“纸上谈兵”——它可以在浏览器中操作页面、在终端执行命令、与Office工具交互、利用搜索功能持续获取反馈,然后根据结果迭代下一步行动。
编程能力是本次升级的重中之重。Step 3.7 Flash针对Agentic Coding场景进行了专项优化,涵盖代码生成、Bug修复、多文件项目理解、终端操作以及自动化开发任务。数据同样具有说服力:相比上一代Step 3.5 Flash,新版在SWE-Bench Pro和Terminal-Bench 2.1等编码评测中均有显著提升,而且在多个主流Agent框架上的表现更加均衡,不再出现“偏科”现象。
搜索能力的强化同样值得关注。模型在搜索规划、证据筛选与信息整合等环节实现了实质性改进,能够应对更复杂的网页搜索、视觉搜索以及跨来源信息综合。当用户任务涉及实时信息获取、长尾实体识别、资料核验或深度研究时,Step 3.7 Flash更像一个主动检索、筛选和整理信息的智能助手,而非被动等待关键词匹配的传统搜索引擎。
在企业级应用方面,Step 3.7 Flash对文档、表格、截图、业务资料以及专业知识类工作同样进行了针对性优化。它能够处理混合输入,结合搜索、工具调用和视觉理解,完成步骤更长的任务链条。从企业报告分析、数据整理,到财务辅助、制造工程任务,再到办公自动化和多工具协作,都能发挥实际价值。
生态兼容性也是Step 3.7 Flash重点考虑的方向。它支持Claude Code、KiloCode、Hermes Agent、OpenClaw等主流Agent框架与Skills,开发者可以较轻松地将它接入现有工作流。在部署方面,既可通过阶跃星辰开放平台直接调用,也能在Web端和App中体验,同时支持OpenRouter、NVIDIA NIM等合作平台。对于企业团队而言,云端、数据中心或本地高内存设备均可部署,灵活度足以应对不同规模的需求。
整体来看,Step 3.7 Flash的发布不仅是简单的版本迭代,更是阶跃星辰将Flash模型推向真实Agent应用的一次关键尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署等多个维度构建了一套较为完整的能力组合。对于正在构建AI Agent、企业自动化工具或多模态应用的开发者而言,这款国产高效率模型确实值得认真关注。
