首页 游戏 软件 资讯 排行榜 专题
首页
AI
我国首部大模型国家标准发布,即日起正式实施

我国首部大模型国家标准发布,即日起正式实施

热心网友
30
转载
2026-01-29

来源:科技日报

科技日报记者 付丽丽

28日,记者从市场监管总局获悉,《人工智能大模型》系列国家标准近日正式实施,标志着我国大模型产业迈入“科学权威、统一规范”的新阶段。

市场监管总局相关负责人介绍,作为首部聚焦通用大模型的国家标准,该系列标准填补了技术评价体系空白,明确了性能、安全与服务能力要求,配套测评能力已获中国合格评定国家认可委员会认可。

基于此构建的“求索”-LMBench测评基准,整合了方法论、数据集与自动化平台,成为行业公认的“能力标尺”。测评体系已形成主流大模型白名单,为央企、国企选型提供依据,并支撑中国石化、南方电网等建设行业大模型,完成了对华为盘古、讯飞星火、中国移动“九天”等模型的场景验证。

截至目前,标准工具已完成千余项测评任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成“研发—测评—应用—升级”闭环。

此外,标准国际化也在同步推进。面向东盟编印英语、老挝语、高棉语版本,填补了区域空白;中国开源模型架构已被新加坡等国项目采用,彰显标准引领下的全球影响力。

来源:https://www.163.com/dy/article/KHUGDD480514R9OJ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智能体评测新阶段为何需要动态基准测试
AI
智能体评测新阶段为何需要动态基准测试

当前AI智能体评测面临两大挑战:验证任务真实完成度及评测任务是否反映现实需求。Claw-Eval通过审计执行过程、日志与环境快照,证明仅看结果会高估模型能力;Claw-Eval-Live则构建动态基准,依据真实工作流定期发布版本,确保评测贴近当下需求。测试显示,模型在跨系统业务任务上表现薄弱,且成本差异显著。

热心网友
05.11
Rtings评测TCL X11L 刷新液晶电视最高分数
业界动态
Rtings评测TCL X11L 刷新液晶电视最高分数

TCL X11L登顶Rtings液晶电视榜首,SQD-Mini LED技术展现统治力 全球电视评测领域最近有个大新闻。权威机构Rtings更新了评测榜单,TCL的X11L以8 6的综合评分,不仅拿下了液晶电视的第一名,刷新了该品类的最高分纪录,更以断崖式的领先优势稳居榜首。这个分数有多厉害?它甚至超

热心网友
04.16
数毛社评测《赛博朋克2077》PS5 Pro更新:光追升级,但仍存局限
科技数码
数毛社评测《赛博朋克2077》PS5 Pro更新:光追升级,但仍存局限

《赛博朋克 2077》PS5 Pro版深度评测:画质全面进化,性能天花板解析 近期,《赛博朋克 2077》正式为PS5 Pro主机推出了专属优化补丁,知名技术评测媒体Digital Foundry随即发布了首份详细分析报告。结论清晰:依托索尼全新的PSSR超分辨率技术与增强版光线追踪,游戏视觉表现实

热心网友
04.16
SidraChain是一个好的区块链吗?SidraChain区块链评测
web3.0
SidraChain是一个好的区块链吗?SidraChain区块链评测

SidraChain区块链评测:重塑合规金融的去中心化新范式 在Web3 0与去中心化金融(DeFi)迅猛发展的今天,区块链技术的应用已远不止于资产交易。一个将伦理框架与去中心化架构深度融合的项目,正在开辟一条独特的道路。SidraChain,作为一个严格遵循伊斯兰教法(Shariah)的公共区块链

热心网友
04.02
OPPO K15 Pro测评:旗舰级电竞性能,续航体验是亮点
网络安全
OPPO K15 Pro测评:旗舰级电竞性能,续航体验是亮点

家人们,K系列又出新品了。哦等等,不是你们想的那个红米K系列啦,今儿给大家端上来的这个K是OPPO K15 Pro系列正文开始之前,先给大家来一波省流,放一个配置表给大家过一下。(图源:雷科技,Na

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

ResearchRabbit使用指南:高效发现你真正需要的研究文献
AI
ResearchRabbit使用指南:高效发现你真正需要的研究文献

ResearchRabbit 是一款设计理念独特的学术发现工具,它通过智能算法深度理解您的研究兴趣,并持续优化推荐相关的学术论文。其核心目标是帮助研究人员高效追踪所关注领域的最新动态与前沿进展。一个显著的亮点在于其智能通知机制:系统会主动筛选,仅推送高相关度的论文,对于不确定是否匹配您兴趣的内容则保

热心网友
05.17
Palettable在线配色工具:AI智能推荐配色方案
AI
Palettable在线配色工具:AI智能推荐配色方案

对于设计师和需要专业配色的用户而言,如何快速找到既美观又高效的色彩方案一直是个挑战。如今,借助人工智能技术,一些在线配色工具能够通过分析大众审美趋势,智能推荐最佳配色组合,让整个过程变得直观而高效。 这类工具的操作方法非常简单:打开网站即可直接开始。系统会基于你对多组配色方案的偏好选择进行学习,并实

热心网友
05.17
Wordmetrics内容分析工具使用指南与功能详解
AI
Wordmetrics内容分析工具使用指南与功能详解

在内容创作与SEO优化实践中,选择合适的工具是提升搜索引擎排名的关键一步。本文将深入解析Wordmetrics——一个融合人工智能与自然语言处理技术的智能内容优化平台,其核心功能在于协助用户高效创建与优化网页内容,从而在搜索结果中获得更靠前的位置。 该平台的工作原理十分智能:用户只需输入目标关键词,

热心网友
05.17
Polymarket CLOBv2升级修复幽灵订单问题 开发者需更新抵押合约地址
web3.0
Polymarket CLOBv2升级修复幽灵订单问题 开发者需更新抵押合约地址

Polymarket已完成CLOBv2迁移,修复了影响交易的“幽灵单”问题,并重构了底层订单簿系统以提升性能。平台已修正做市商返利,并将发放约50万美元的流动性奖励。开发者需及时更新抵押适配器合约地址,否则用户后续可能无法正常交易。

热心网友
05.17
Wisio人工智能科学写作助手使用指南
AI
Wisio人工智能科学写作助手使用指南

对于全球科研工作者而言,用非母语的英语进行学术写作是一项普遍挑战。Wisio作为一个由人工智能驱动的科学写作辅助平台,致力于通过多项智能化功能帮助研究者克服语言障碍。它能够提供符合学术规范的个性化文本润色建议,支持将多种语言的内容精准翻译为地道的科学英语,并能即时检索、引用最新的相关文献,从而显著提

热心网友
05.17