游乐游手机版
首页/科技数码/文章详情

Step-DeepResearch端到端模型:阶跃星辰开源高效深度研究方案

时间:2025-12-30 11:37
阶跃星辰正式开源了参数量达320亿(32B)的深度研究专用大模型:Step-DeepResearch。该模型在深度研究任务上的表现已比肩OpenAI o3-mini与Gemini

阶跃星辰正式开源了参数量高达320亿的全新深度研究专用大模型:Step-DeepResearch。该模型在完成深度研究任务上的综合表现,已能比肩OpenAI的o3-mini以及Google的Gemini 2.0 Flash等顶尖商业方案,而每次实际调用所需的成本却仅为它们的十分之一甚至更低。

阶跃星辰开源 Step-DeepResearch,经济高效的端到端深度研究模型

https://www.php.cn/link/ae5ef52da81b8f483ac166475587ad87

模型简介

Step-DeepResearch是一款兼顾高性能与高性价比的端到端深度研究智能体模型。它专为开放式科研场景中的自主信息挖掘与专业级报告生成而打造,力求成为研究者手中的得力工具。

  • 原子能力融合:它将复杂的研究流程,拆解为一系列可学习、可评估的原子能力模块(涵盖任务规划、多源信息检索、多轮反思与交叉验证、结构化报告生成等),并在模型内部实现深度融合。这种机制确保了单次前向推理就能完成闭环式思考与实时纠错。
  • 渐进式智能体训练范式:它构建了一条从智能体中期训练、监督微调(SFT)到强化学习(RL)的全链路优化路径。它将建模核心目标从传统语言建模的“预测下一个词元”,转向为“决策下一个原子动作”,从而显著提升了模型在动态、不确定的研究环境下的适应性与泛化能力。
  • 小模型,大能力:虽然参数量仅为320亿,但Step-DeepResearch在严格遵循Scale AI Research Rubrics基准的测试中获得了61.4的高分,表现与OpenAI Deep Research及Gemini Deep Research等闭源旗舰模型持平。在更加贴近实践的ADR-Bench专家人工评测中,其Elo得分更是超越了DeepSeek-v3.2、GLM-4.6等参数量更大的模型,整体表现直追顶级商业方案。
  • 极致成本优势:在能够维持专家级研究质量的前提下,它大幅压缩了部署与推理开销,成为了业界单位性能成本最低的深度研究智能体解决方案,让高质量研究更加普惠。
  • 便捷接入方式:支持通过StepFun开放平台API直接调用,新注册用户首月可免费体验其全部能力。

阶跃星辰开源 Step-DeepResearch,经济高效的端到端深度研究模型

(左)研究效能-成本权衡图谱:Step-DeepResearch以61.42的高分逼近性能天花板,同时每次推理的计算成本(人民币)显著低于同类商业方案,稳居高效能前沿位置。(右)ADR-Bench专家评分对比:在所有评估维度中,Step-DeepResearch均取得领先的Elo分数,综合实力足以媲美一线闭源模型。

架构设计

Step-DeepResearch采用基于经典ReAct范式的智能体架构。它依托“推理→行动→反思”的迭代循环机制,来驱动整个自主、可控、可追溯的深度研究过程。

模型原生支持本地化部署与执行。它内置了四大核心工具集:batch_web_surfer(用于批量网页搜索与内容提取)、file(支持本地文件读写与编辑)、todo(用于研究任务状态追踪与管理)、shell(支持执行系统级命令),全面覆盖了科研全流程的实际操作需求。

阶跃星辰开源 Step-DeepResearch,经济高效的端到端深度研究模型

Step-DeepResearch系统架构示意:智能体在ReAct循环中,通过协同调用专用工具(如batch_web_surfer、todo、shell等)来完成任务规划、分步执行与结果反思,最终输出结构严谨、内容可靠的研究报告。

开源地址:https://www.php.cn/link/ae5ef52da81b8f483ac166475587ad87

源码地址:点击下载

来源:https://www.php.cn/faq/1904960.html?uid=1246273
上一篇比特币价格飙涨201%,如何抓住牛市机遇? 下一篇滴滴回应“关爱公益救助”需缴费:警惕新型诈骗手段
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5