游乐游手机版
首页/科技数码/文章详情

信通院发布"方升"3.0标准,推动AI评测与产业创新

时间:2025-12-08 19:53
中国信息通信研究院(以下简称“信通院”)近日宣布,其自主研发的“方升”人工智能基准测试体系已完成3 0版本升级,标志着我国AI评测能力迈入新阶段。此次升级不仅扩展了基础测试维度,更首次将全模态理解、

中国信息通信研究院(简称"信通院")日前发布重磅消息,"方升"人工智能基准测试体系迎来3.0版本的全面升级。这一突破性进展代表着我国AI评估技术实现质的飞跃。新版评测系统不只是简单扩充基础测试项目,更重要的是在全球范围内率先纳入全模态理解、长期记忆等10项前沿智能能力评估指标,为工业智能化、金融科技创新等关键领域打造了更精准的评判标准。

据悉,3.0版本创造性地增加了模型底层特征分析模块,系统性评估参数规模、推理速度等核心技术指标。着眼人工智能未来发展,专门设计了高阶智能测试单元,重点验证模型在多模态交互、复杂决策等领域的实战能力。信通院技术专家强调,这种分层评估架构既可精准把握当前产业现状,又能为科研攻关指明方向。

为确保评估结果的公信力,信通院同步启动了三大基础建设工程。首当其冲是测试数据库的扩容计划,将新增300万条跨语言、跨领域的标准化测试数据。其次是评测方法的创新突破,聚焦高质量合成数据生成、动态质量监控等核心技术研发。最具前瞻性的是智能化评测基座的建设,通过打造多智能体协同仿真环境,实现对复杂系统交互能力的精确度量。

最新季度的测评结果显示,参与评估的141个主流大模型和7个智能系统展现出差异化优势。测试涵盖基本认知、逻辑推演、编程生成、多模态理解等核心维度。数据分析表明,GPT-5依然保持综合性能领先,但国产模型表现抢眼——阿里巴巴通义千问3.0和月之暗面Kimi K2在特定应用场景已与国际顶尖水平比肩。特别值得注意的是,多模态模型在视觉识别领域突破明显,但在需要复杂推理的任务链上仍需提升。

专项代码能力测试揭示了行业普遍存在的技术痛点。虽然参评模型在简单编码任务上得心应手,但在实际工程涉及的架构设计、异常处理等关键环节表现欠佳。业内专家认为,这凸显了AI技术从理论研究到产业落地过程中亟待解决的工程化难题。

伴随着评测体系的持续精进,信通院已建立双月发布的常态化评估机制。相关负责人表示,下一阶段将重点推进评测标准的国际化进程,通过与全球顶尖研究机构深度合作,助力中国AI评估体系赢得国际话语权,为科技自主创新和产业转型升级提供坚实支撑。

来源:https://www.itbear.com.cn/html/2025-10/981396.html
上一篇云深处DR02人形机器人:IP66防护+多行业智能化应用指南 下一篇10款热销保险柜测评:为贵重资产挑选最佳防护
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
LiblibAI云端WebUI降低AI绘画部署门槛
科技数码 · 2026-07-02

LiblibAI云端WebUI降低AI绘画部署门槛

LiblibAI在线WebUI的核心优势在于——只需通过浏览器即可流畅运行Stable Diffusion,无需自行搭建本地环境。云端直接处理运算,模型即选即试,大幅降低了AI绘画的创作门槛。对于轻量创作和模型快速测试来说,体验相当顺畅,但用户仍需重视数据隐私保护和版权合规等问题。 过去使用Stab

微软因用户不安叫停Edge浏览器AI历史搜索功能
科技数码 · 2026-07-02

微软因用户不安叫停Edge浏览器AI历史搜索功能

微软紧急暂停Edge浏览器AI历史搜索功能,该功能因被用户吐槽“令人不安”而暂缓部署。尽管微软强调所有AI处理在设备端完成且数据不上传云端,但用户仍不信任。此举与WindowsK2计划减少功能堆砌的理念一致。

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场
科技数码 · 2026-07-02

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场

【CNMO科技消息】近日,红魔游戏平板5 Pro正式发布。这款平板从定位上就明确瞄准“极致游戏”体验,外观方面带来了一个重磅亮点——首次引入RGB水冷散热系统,背部那条可视化的水路通道,配合纯平透明背板设计,核心配置信息一览无余,科技感十足。 图源网络 屏幕方面同样表现突出。一块9 06英寸OLED

杭州全国首所机器人学校首批30台机器人入学
科技数码 · 2026-07-02

杭州全国首所机器人学校首批30台机器人入学

30台机器人整齐列队,有的刚从生产线卸下,机械零件还带着崭新的“工业气息”;有的已搭载运动控制模块,能稳健地小跑、跳跃几下。它们来自不同制造工厂,外形与功能各有千秋,但此刻都拥有了同一个身份——杭州机器人学校的第一批入学新生。 6月30日,杭州经信正式发布:由浙江大学机器人研究院、浙江省质量科学研究

美国计划发射航天器托举天文卫星
科技数码 · 2026-07-02

美国计划发射航天器托举天文卫星

就在最近,NASA公布了一项非常果断的干预计划——他们定于6月30日实施一次“卫星维修任务”,派遣一台名为“连接”号的机器人服务卫星,为一颗超期服役的天文卫星延长运行寿命。这颗卫星是“尼尔·格雷尔斯·斯威夫特天文台”,其轨道高度正在不断衰减,如果不进行干预,今年年底前很可能会坠入地球大气层并烧毁。