通义3B大模型登顶权威评测，阿里开源DeepResearch助力AI生态

时间：2025-12-14 10:45

阿里巴巴近日宣布，正式开源其首个深度研究智能体模型——通义DeepResearch，为全球开发者攻克复杂研究任务提供了全新工具。该模型在多个权威评测基准中表现亮眼，以30亿激活参数的轻量化设计，超越

阿里巴巴近日重磅推出首个深度研究智能体开源项目——通义DeepResearch，这款创新工具将为全球开发者处理复杂研究任务带来突破性解决方案。凭借30亿激活参数的轻巧架构，该模型已在多个国际评测中展示出卓越性能，一举超越OpenAI o3、DeepSeek V3.1及Claude-4-Sonnet等主流智能体框架。

在多维度专业测试中，包括Humanity’s Last Exam（HLE）、BrowseComp系列、GAIA等评估体系，通义DeepResearch展现出与众不同的推理能力。其独创性地破解了传统方法在执行长周期任务时面临的"认知瓶颈"与"噪音累积"两大难题，大幅提升了复杂场景下的任务完成质量。

技术团队创新性地采用了Qwen3-30B-A3B模型作为核心架构，通过独特的合成数据训练系统实现了全流程优化。异步强化学习算法与智能数据筛选机制的完美配合，使得模型在真实和模拟环境中都获得了显著的泛化能力。特别在处理多层级验证的复杂任务时，模型展现出了出色的优先级判断能力，有效规避了信息超载引发的性能下降。

智能推理系统采用了灵活的双模设计：ReAct模式专注于基础能力的高效评估，满足快速验证需求；Heavy模式则通过动态扩展策略最大化模型潜能，确保在跨学科、长周期研究中保持稳定表现。这种创新架构兼顾了日常应用的效率和专业研究的深度。

目前该项目已在GitHub、Hugging Face及魔搭社区全面开放，提供30亿参数版本（A3B）的全部模型资源与技术文档。这延续了阿里在AI智能体领域的开源传统，此前问世的WebWalker等检索推理工具已在开发者社群获得广泛应用。

业界专家分析认为，通义DeepResearch开创了"轻量高效"的智能研究新范式。其采用的数据合成训练技术显著降低了对传统数据资源的依赖，同时在医疗诊断、金融分析等专业领域展现出强大适应力，为处理海量异构数据提供了全新解决方案。

来源：https://www.itbear.com.cn/html/2025-09/959932.html

上一篇一加15即将发布：告别哈苏，首发自研影像技术 下一篇小鹏P7新车上市7分钟订单破万，重塑智能电车爆款神话

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售，支持4K165Hz与FHD520Hz双模切换，定价1888元。采用FastIPS面板，97%DCI-P3色域，配备升降支架及双HDMI2 1和双DP1 4接口。

科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年，DRAM与NAND闪存的供应持续紧张及价格不断攀升，正逐步传导至终端消费市场。可以预见，下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价，最终连苹果也不得不跟进，宣布提升iPad、Mac及家居设备的价格，以应对存储成本的快速上涨。 TrendForce分析指出，苹果全面