阿里巴巴近日重磅推出首个深度研究智能体开源项目——通义DeepResearch,这款创新工具将为全球开发者处理复杂研究任务带来突破性解决方案。凭借30亿激活参数的轻巧架构,该模型已在多个国际评测中展示出卓越性能,一举超越OpenAI o3、DeepSeek V3.1及Claude-4-Sonnet等主流智能体框架。
在多维度专业测试中,包括Humanity’s Last Exam(HLE)、BrowseComp系列、GAIA等评估体系,通义DeepResearch展现出与众不同的推理能力。其独创性地破解了传统方法在执行长周期任务时面临的"认知瓶颈"与"噪音累积"两大难题,大幅提升了复杂场景下的任务完成质量。
技术团队创新性地采用了Qwen3-30B-A3B模型作为核心架构,通过独特的合成数据训练系统实现了全流程优化。异步强化学习算法与智能数据筛选机制的完美配合,使得模型在真实和模拟环境中都获得了显著的泛化能力。特别在处理多层级验证的复杂任务时,模型展现出了出色的优先级判断能力,有效规避了信息超载引发的性能下降。
智能推理系统采用了灵活的双模设计:ReAct模式专注于基础能力的高效评估,满足快速验证需求;Heavy模式则通过动态扩展策略最大化模型潜能,确保在跨学科、长周期研究中保持稳定表现。这种创新架构兼顾了日常应用的效率和专业研究的深度。
目前该项目已在GitHub、Hugging Face及魔搭社区全面开放,提供30亿参数版本(A3B)的全部模型资源与技术文档。这延续了阿里在AI智能体领域的开源传统,此前问世的WebWalker等检索推理工具已在开发者社群获得广泛应用。
业界专家分析认为,通义DeepResearch开创了"轻量高效"的智能研究新范式。其采用的数据合成训练技术显著降低了对传统数据资源的依赖,同时在医疗诊断、金融分析等专业领域展现出强大适应力,为处理海量异构数据提供了全新解决方案。
