游乐游手机版
首页/业界动态/文章详情

阶跃发布Step3.7Flash面向生产的高效Agent模型

时间:2026-05-30 11:34
5月29日,基础大模型创业公司阶跃星辰正式发布并开源了 Step 3 7 Flash 模型。这款专为生产级 Agent 打造的 Flash 模型,据称在速度、成本、可靠执行以及复杂任务处理能力之间实现了更优平衡。 Agent 正从演示阶段快速迈向真实的企业生产环境,这给基础模型带来了全新挑战。不再仅

5月29日,基础大模型创业公司阶跃星辰正式发布并开源了 Step 3.7 Flash 模型。这款专为生产级 Agent 打造的 Flash 模型,据称在速度、成本、可靠执行以及复杂任务处理能力之间实现了更优平衡。

Agent 正从演示阶段快速迈向真实的企业生产环境,这给基础模型带来了全新挑战。不再仅仅比拼峰值智能——而是要在应用场景中追求规模化的高效智能。换句话说,模型不仅要能回答问题,更要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮长程任务中保持执行的一致性。

那么,Step 3.7 Flash 具体采用了什么配置?它基于稀疏 MoE 架构,总参数达到 196B+1.8B(ViT),激活参数仅为 11B,最高生成速度可达 400 Tokens/s。这种配置特别适合高频、多轮的 Agent 应用场景,能够显著提升任务完成效率。从能力来看,模型针对生产级 Agent 场景的需求,重点优化了四个方面:原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排,以及 Agent 生态兼容性。

具体来说,Step 3.7 Flash 可以直接处理 UI 界面、图表、文档、图片以及各类应用界面,把复杂的视觉信息转化为结构化的结果和可执行的任务。遇到信息不确定的情况,它还会主动发起搜索进行交叉验证。而在生产级 Agent 最核心的环节——工具调用的可靠性上,该模型做了专门的优化,能在长程多轮工作流中稳定调用 API、浏览器、终端、Office 工具等,显著降低跑偏和执行失败的风险。

阶跃发布 Step 3.7 Flash:为生产级场景打造高效率 Agent 模型

图为Step 3.7 基准测试结果

从基准测试数据来看,Step 3.7 Flash 在 SimpleVQA (Search)、V* (Python) 这类复杂视觉任务的 Benchmark 上,展现出足以媲美更大规模旗舰模型的能力。在考察多工具协同的 Toolathlon 测试中,它取得了 49.5% 的成绩;在衡量真实环境下日常自主任务执行的 ClawEval-1.1 上,得分为 67.1%;在横跨 44 种职业的 GDPval 上达到了 45.8%。更令人印象深刻的是,在 τ²-bench Telecom 的低、中、高三个推理难度下,通过率均超过 98%。这意味着在真实的多轮 Agent 工作流中,模型能稳定调用 API、浏览器、终端、Office 和外部系统,保持任务轨迹一致,跑偏和执行失败的风险显著降低。

阶跃星辰还对主流 Agent 框架和工具调用协议做了兼容性优化。Step 3.7 Flash 可以稳定接入 Claude Code、OpenClaw、Hermes Agent 等主流的 Coding 与 Agent 工具,并同时支持云端和本地部署,有效降低了开发者的接入门槛和工作流编排成本。

在行业观察者看来,随着各行各业加速推进 Agent 落地,Step 3.7 Flash 的设计理念也传递出一个重要信号:Flash 类模型的角色正在发生转变——从单纯的轻量替代品,逐步演变为支撑生产级 Agent 规模化落地的基础设施。今年 2 月,阶跃开源了该系列的上一个版本 Step 3.5 Flash,同样主打极速、高效地完成 Agent 场景任务,上线仅一个月就登顶 OpenRouter 平台 OpenClaw 调用量月榜全球第一。

阶跃方面透露,后续将围绕 Step 3.7 Flash 推出生态共建计划和生态伙伴限时体验活动,与开发者一起探索 Agent 效率的评估方式、工程实践以及落地场景。

来源:https://www.leiphone.com/category/industrynews/ZLYbJRAV6CIDAqcL.html
上一篇美团即时零售AI方案发布,一条指令管理百家门店 下一篇戴尔单季营收438亿美元创纪录 AI服务器收入暴涨757%
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
小学生学习平板优质品牌推荐 护眼与学习兼顾
业界动态 · 2026-05-30

小学生学习平板优质品牌推荐 护眼与学习兼顾

给家里的小学生挑选学习平板,这与购买普通娱乐平板电脑完全是两回事。核心需要盯住三点:学习辅助效果如何、护眼技术是否可靠、以及能否帮助培养良好学习习惯。既要拥有专业的学习资源和护眼科技,还得具备能有效管理孩子使用的管控功能。目前市面上的学习平板品牌众多,质量良莠不齐。这次我们从教育专业性、护眼能力、资

2026语文培优学习机热门机型推荐
业界动态 · 2026-05-30

2026语文培优学习机热门机型推荐

语文作为母语学科,贯穿读、写、听、说四大核心能力,夯实基础需长期积淀,能力提升贵在日积月累。2026年,多款语文学习机聚焦培优赛道,搭载AI阅读指导、作文智能批改、古诗文精讲、识字写字辅导等功能,精准破解读写痛点。本文从阅读、写作、古诗文、基础识字、AI辅导五个维度,推荐三款语文提升效果突出的热门机

2026年学习平板选购:AI教研双赋能,5款旗舰深度解析
业界动态 · 2026-05-30

2026年学习平板选购:AI教研双赋能,5款旗舰深度解析

数字化转型在教育行业持续深入,一个很直观的变化是:学习平板已经从“可选”进化到了“刚需”。跟主打娱乐、轻办公的普通平板不同,专业的学习平板,核心卖点是权威的教研内容、扎实的护眼技术,以及能真正帮上忙的智能辅导,精准对应从小学到高中各个阶段的实际需求。眼看 618 就要到了,市面上的选择五花八门,家长

放置大陆Steam上线 零操作挂机RPG 离线成长深度养成全中文
业界动态 · 2026-05-30

放置大陆Steam上线 零操作挂机RPG 离线成长深度养成全中文

今天为大家介绍一款以“放手”为核心玩法的放置类RPG——《放置大陆》。虽然并非3A大作,但它的设计非常纯粹:角色离线时依然自动打怪、刷宝、积累资源,技能与装备系统拥有深度养成路线,数值成长带来的畅快感丝毫不减。简单来说,它将传统RPG中的职业发展、资源循环、世界探索等核心要素,全部浓缩为一种“你尽管

2026养宠家庭洗地机首选专治宠物尿渍异味
业界动态 · 2026-05-30

2026养宠家庭洗地机首选专治宠物尿渍异味

```html 养宠家庭的地面清洁,算得上是家务中不得不正视的难题了。家里有猫有狗,难免会碰上它们随机留下的“小意外”——尿渍、呕吐物、掉落的猫粮狗粮,还有四季不断的掉毛。更让人头疼的是,宠物长期趴卧、舔舐过的地方,地面即便看着干净,也往往藏着肉眼看不见的尿渍、异味甚至细菌。不少家庭的日常就是“拖完