游乐游手机版
首页/科技数码/文章详情

国家数据集管理服务平台上线,能否缓解AI“数据饥渴”?

时间:2026-04-30 17:16
数据饥渴时代,国家平台如何为AI“解渴”? “有多少数据,就有多少AI能力;数据质量越好,AI能力就越强。”这句话在AI行业已是共识。就在近日的第九届数字中国建设峰会上,宇树科技创始人王兴兴再次强调了数据的关键作用:但凡拥有足够高质量数据的领域,现有AI技术基本都能解决问题。他同时指出,像人形机器人

数据饥渴时代,国家平台如何为AI“解渴”?

“有多少数据,就有多少AI能力;数据质量越好,AI能力就越强。”这句话在AI行业已是共识。就在近日的第九届数字中国建设峰会上,宇树科技创始人王兴兴再次强调了数据的关键作用:但凡拥有足够高质量数据的领域,现有AI技术基本都能解决问题。他同时指出,像人形机器人这样的前沿领域,数据依然十分稀缺,亟需大量高质量数据来支撑。

无独有偶,蚂蚁集团研究院院长李振华在同一场合也谈到,高质量的标注数据,如今已成为制约模型智能上限的一大痛点。特别是在那些专业垂直领域,国内大模型与海外同行相比,在高质量标注数据的积累和构建上,差距依然明显。

那么,如何缓解整个行业的“数据饥渴”,加速高质量数据集的建设和流通呢?一个国家级平台给出了新的答案。


国家数据集管理服务平台正式首页。

4月29日,从国家数据局传来消息,国家数据集管理服务平台在数字中国建设峰会上正式发布并启动试运行。这标志着我国高质量数据集建设工作,迈入了集约化、平台化管理的新阶段。用户只需访问平台官网,就能进入一个全新的数据资源世界。

目前,平台已汇聚了1000余个数据集。用户可以根据模态(文本、图像、音视频、3D等)、领域、行业或供给方进行筛选,也可以主动发布自己的数据需求。浏览一下需求专区,就能感受到市场的热度:北京国际大数据交易所在4月9日提交了“具身智能训练数据”的需求,目标场景是家居操作;科大讯飞则发布了“中文情感对话数据”的需求,希望获取累计不低于1000小时、涉及不低于1000人的两人情感陪伴对话数据。目前,这些需求的状态都显示为“待洽谈”,等待着合适的供给方来对接。

这个平台究竟服务谁?根据国家数据局的介绍,其核心用户有三类:一是为数据管理部门提供数据集目录管理和建设情况监测功能,提升管理效能;二是为数据集供给方提供发布、凭证申领和质量测评等服务,赋能高质量数据集建设;三是为数据集需求方提供查询检索和需求发布通道,加快数据集的流通与利用。可以说,它旨在打通供需两侧,构建一个高效的连接枢纽。


国家数据集管理服务平台正式页面。

数据正在以前所未有的速度赋能人工智能创新。峰会期间发布的《全国数据资源调查报告(2025年)》显示,国内已建成的高质量数据集数量超过11万个,总规模突破908拍字节(PB),全年词元调用量约达21100万亿。一个明显的趋势是,市场对数据的需求,正从基础语料向更深度的行业高质量数据集快速拓展。

“当前,人工智能正处于从‘可用’迈向‘好用’的关键跃升期。”国家数据发展研究院副院长袁军分析道,“高质量数据集作为大模型训练的‘基石’,其供给规模和质量,直接决定了人工智能的创新高度和产业落地深度。”

然而,理想丰满,现实却仍有骨感之处。袁军指出,国内高质量数据集的建设和流通,客观上仍面临三大痛点:一是建设主体分散,管理部门难以全面掌握资源底数;二是供给侧信息不对称,容易导致重复建设和质量参差不齐;三是需求侧获取成本高、周期长,拖慢了技术创新的效率。正是为了破解这些难题,国家数据集管理服务平台应运而生。

据了解,该平台由国家数据局指导、国家数据发展研究院建设和运营,目前已开放供需发布、全域检索等基本功能。更关键的是,它已与国家数据基础设施及安徽省等地方平台完成对接。袁军透露,未来平台还将联通国家公共数据资源登记平台、国家数据产权登记服务平台,并支持更多地方与行业平台对接,最终形成国家级平台牵引、多方协同的一体化格局。

下一步怎么走?平台的规划很清晰:持续扩大用户范围,广泛调动各类重点供需主体,快速提升用户与资源规模。预计到2026年底,全面建成一个覆盖数据集全生命周期、贯通各地区各部门的一体化管理服务体系。

可以预见,国家数据集管理服务平台的正式登场,有望有效破解高质量数据集的建设痛点,打通供需流通的堵点,为人工智能的规模化应用注入一股强劲而持续的动能。

采写:南都N视频记者李玲 杨柳 发自北京

来源:https://www.163.com/dy/article/KRPANFP005129QAF.html
上一篇上汽大众与神州租车签署年度框架采购协议,首批新车交付 下一篇开发者恢复拓竹3D打印机受限功能,遭法务威胁后关停项目
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宇树验证具身智能新趋势核心战场不止于模型
科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

智元精灵G2机器人产线直播完成64828件成功率99.99%
科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

纯电动Cayenne首秀保时捷驾驶中心全国路演
科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

AI工具能否成为高价志愿咨询纠纷的破局之道
科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

头部企业全产业链布局锂电池回收循环
科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持