阶跃星辰发布Step 3.7 Flash 面向真实Agent场景的高效多模态模型_AI热点日报

阶跃星辰发布Step 3.7 Flash 面向真实Agent场景的高效多模态模型

类型：热点整理2026-05-29

2026年5月29日，阶跃星辰正式推出新一代高效率Flash模型——Step 3 7 Flash。如果说之前的模型更偏向单向的问答交互，那么这一次，Step 3 7 Flash的核心突破显然在于“理解之后主动执行”。它不再满足于给出答案，而是在多模态感知、网页与视觉搜索、工具调用、代码执行以及完整的

2026年5月29日，阶跃星辰正式推出新一代高效率Flash模型——Step 3.7 Flash。如果说之前的模型更偏向单向的问答交互，那么这一次，Step 3.7 Flash的核心突破显然在于“理解之后主动执行”。它不再满足于给出答案，而是在多模态感知、网页与视觉搜索、工具调用、代码执行以及完整的Agent工作流方面，完成了一套系统性的能力升级。

从技术架构来看，Step 3.7 Flash采用稀疏MoE视觉语言模型，将文本、图像、代码、搜索和工具调用能力深度融合在一起。官方信息显示，它能够理解产品界面、文档、图表以及各类自然场景中的视觉输入，并基于所看到的内容生成代码或调用工具完成任务。对于AI Agent而言，这意味着模型不再“纸上谈兵”——它可以在浏览器中操作页面、在终端执行命令、与Office工具交互、利用搜索功能持续获取反馈，然后根据结果迭代下一步行动。

编程能力是本次升级的重中之重。Step 3.7 Flash针对Agentic Coding场景进行了专项优化，涵盖代码生成、Bug修复、多文件项目理解、终端操作以及自动化开发任务。数据同样具有说服力：相比上一代Step 3.5 Flash，新版在SWE-Bench Pro和Terminal-Bench 2.1等编码评测中均有显著提升，而且在多个主流Agent框架上的表现更加均衡，不再出现“偏科”现象。

搜索能力的强化同样值得关注。模型在搜索规划、证据筛选与信息整合等环节实现了实质性改进，能够应对更复杂的网页搜索、视觉搜索以及跨来源信息综合。当用户任务涉及实时信息获取、长尾实体识别、资料核验或深度研究时，Step 3.7 Flash更像一个主动检索、筛选和整理信息的智能助手，而非被动等待关键词匹配的传统搜索引擎。

在企业级应用方面，Step 3.7 Flash对文档、表格、截图、业务资料以及专业知识类工作同样进行了针对性优化。它能够处理混合输入，结合搜索、工具调用和视觉理解，完成步骤更长的任务链条。从企业报告分析、数据整理，到财务辅助、制造工程任务，再到办公自动化和多工具协作，都能发挥实际价值。

生态兼容性也是Step 3.7 Flash重点考虑的方向。它支持Claude Code、KiloCode、Hermes Agent、OpenClaw等主流Agent框架与Skills，开发者可以较轻松地将它接入现有工作流。在部署方面，既可通过阶跃星辰开放平台直接调用，也能在Web端和App中体验，同时支持OpenRouter、NVIDIA NIM等合作平台。对于企业团队而言，云端、数据中心或本地高内存设备均可部署，灵活度足以应对不同规模的需求。

整体来看，Step 3.7 Flash的发布不仅是简单的版本迭代，更是阶跃星辰将Flash模型推向真实Agent应用的一次关键尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署等多个维度构建了一套较为完整的能力组合。对于正在构建AI Agent、企业自动化工具或多模态应用的开发者而言，这款国产高效率模型确实值得认真关注。

来源：https://www.aihub.cn/news/step-3-7-flash-release/

多模态模型

延伸阅读

补充最近整理过的热点入口。

阶跃星辰发布Step 3.7 Flash 面向真实Agent场景的高效多模态模型

相关热点

延伸阅读