清华大学自然语言处理实验室、中国人民大学、面壁智能与OpenBMB社区联合发布一款在人工智能领域备受瞩目的研究成果——业内首个参数量仅为4B的端侧智能体模型AgentCPM-Explore。此次合作推出的模型,在GAIA、HLE、BrowserComp等8项主流长程智能体基准测试中均展现出卓越性能,不仅刷新了同参数量级模型的性能纪录,更展现出超越部分8B模型的推理能力,部分指标甚至接近某些30B+大模型的表现。该模型支持超过100轮连贯、稳定、具备逻辑性的多步骤交互,展现出类人探索特质,如质疑精神、实证意识、灵活应变与目标导向。

AgentCPM-Explore核心能力一览
- 突破规模限制:作为业界首款在GAIA、Xbench、BrowserComp等8个高难度长程智能体任务上均取得优异表现的4B端侧模型,它重新定义了轻量化智能体的能力边界;
- 持续深度探索:能够稳定执行逾100轮无重复、高一致性的环境交互,持续推动复杂任务的进展直至达成精准闭环;
- 全栈开源支持:除模型本身外,同步开源工具调度平台AgentDock、全异步强化学习训练框架AgentRL、以及一体化智能体评测系统AgentToLeaP,实现了从训练、部署到评估的完整技术链路开源,助力社区高效复现与自主迭代。

本次开源内容全面覆盖模型权重、强化学习训练代码、标准化评测套件及工具集成平台。
Github、HuggingFace、ModelScope以及魔乐社区的相关资源均已开放。
项目源码可通过上述提供的官方渠道获取。
