信通院发布"方升"3.0标准，推动AI评测与产业创新

时间：2025-12-08 19:53

中国信息通信研究院（以下简称“信通院”）近日宣布，其自主研发的“方升”人工智能基准测试体系已完成3 0版本升级，标志着我国AI评测能力迈入新阶段。此次升级不仅扩展了基础测试维度，更首次将全模态理解、

中国信息通信研究院（简称"信通院"）日前发布重磅消息，"方升"人工智能基准测试体系迎来3.0版本的全面升级。这一突破性进展代表着我国AI评估技术实现质的飞跃。新版评测系统不只是简单扩充基础测试项目，更重要的是在全球范围内率先纳入全模态理解、长期记忆等10项前沿智能能力评估指标，为工业智能化、金融科技创新等关键领域打造了更精准的评判标准。

据悉，3.0版本创造性地增加了模型底层特征分析模块，系统性评估参数规模、推理速度等核心技术指标。着眼人工智能未来发展，专门设计了高阶智能测试单元，重点验证模型在多模态交互、复杂决策等领域的实战能力。信通院技术专家强调，这种分层评估架构既可精准把握当前产业现状，又能为科研攻关指明方向。

为确保评估结果的公信力，信通院同步启动了三大基础建设工程。首当其冲是测试数据库的扩容计划，将新增300万条跨语言、跨领域的标准化测试数据。其次是评测方法的创新突破，聚焦高质量合成数据生成、动态质量监控等核心技术研发。最具前瞻性的是智能化评测基座的建设，通过打造多智能体协同仿真环境，实现对复杂系统交互能力的精确度量。

最新季度的测评结果显示，参与评估的141个主流大模型和7个智能系统展现出差异化优势。测试涵盖基本认知、逻辑推演、编程生成、多模态理解等核心维度。数据分析表明，GPT-5依然保持综合性能领先，但国产模型表现抢眼——阿里巴巴通义千问3.0和月之暗面Kimi K2在特定应用场景已与国际顶尖水平比肩。特别值得注意的是，多模态模型在视觉识别领域突破明显，但在需要复杂推理的任务链上仍需提升。

专项代码能力测试揭示了行业普遍存在的技术痛点。虽然参评模型在简单编码任务上得心应手，但在实际工程涉及的架构设计、异常处理等关键环节表现欠佳。业内专家认为，这凸显了AI技术从理论研究到产业落地过程中亟待解决的工程化难题。

伴随着评测体系的持续精进，信通院已建立双月发布的常态化评估机制。相关负责人表示，下一阶段将重点推进评测标准的国际化进程，通过与全球顶尖研究机构深度合作，助力中国AI评估体系赢得国际话语权，为科技自主创新和产业转型升级提供坚实支撑。

来源：https://www.itbear.com.cn/html/2025-10/981396.html

上一篇云深处DR02人形机器人：IP66防护+多行业智能化应用指南 下一篇10款热销保险柜测评：为贵重资产挑选最佳防护

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-02

LiblibAI云端WebUI降低AI绘画部署门槛

LiblibAI在线WebUI的核心优势在于——只需通过浏览器即可流畅运行Stable Diffusion，无需自行搭建本地环境。云端直接处理运算，模型即选即试，大幅降低了AI绘画的创作门槛。对于轻量创作和模型快速测试来说，体验相当顺畅，但用户仍需重视数据隐私保护和版权合规等问题。过去使用Stab

科技数码 · 2026-07-02

微软因用户不安叫停Edge浏览器AI历史搜索功能

微软紧急暂停Edge浏览器AI历史搜索功能，该功能因被用户吐槽“令人不安”而暂缓部署。尽管微软强调所有AI处理在设备端完成且数据不上传云端，但用户仍不信任。此举与WindowsK2计划减少功能堆砌的理念一致。

科技数码 · 2026-07-02

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场

【CNMO科技消息】近日，红魔游戏平板5 Pro正式发布。这款平板从定位上就明确瞄准“极致游戏”体验，外观方面带来了一个重磅亮点——首次引入RGB水冷散热系统，背部那条可视化的水路通道，配合纯平透明背板设计，核心配置信息一览无余，科技感十足。图源网络屏幕方面同样表现突出。一块9 06英寸OLED

科技数码 · 2026-07-02

杭州全国首所机器人学校首批30台机器人入学

30台机器人整齐列队，有的刚从生产线卸下，机械零件还带着崭新的“工业气息”；有的已搭载运动控制模块，能稳健地小跑、跳跃几下。它们来自不同制造工厂，外形与功能各有千秋，但此刻都拥有了同一个身份——杭州机器人学校的第一批入学新生。 6月30日，杭州经信正式发布：由浙江大学机器人研究院、浙江省质量科学研究

科技数码 · 2026-07-02

美国计划发射航天器托举天文卫星

就在最近，NASA公布了一项非常果断的干预计划——他们定于6月30日实施一次“卫星维修任务”，派遣一台名为“连接”号的机器人服务卫星，为一颗超期服役的天文卫星延长运行寿命。这颗卫星是“尼尔·格雷尔斯·斯威夫特天文台”，其轨道高度正在不断衰减，如果不进行干预，今年年底前很可能会坠入地球大气层并烧毁。