今天,国家数据局正式对外发布了《关于推进行业高质量数据集建设行动的实施方案》。这是国家层面首次针对“数据赋能人工智能发展”这一重大课题,展开系统性、全局性的顶层设计。其释放的政策信号,意义十分深远。

细看这份方案,它围绕行业高质量数据集的供给、流通、应用三大关键环节,一口气部署了六大专项行动。例如,方案明确要求面向AI的应用需求,持续推进文本、图像、音视频等多模态高质量数据集的建设;同时,针对智能体、具身智能、世界模型等前沿重点方向,也加速推进相关数据集建设。此外,方案还鼓励具备条件的地区,因地制宜探索设立数据标注创新试验区。可以说,从“造数据”到“用数据”,每个环节都有了清晰的发展方向。
数据是什么?数据正是AI训练赖以生存的“核心原料”。高质量的数据集,相当于给大模型喂足“好料”,其性能自然能快速提升。专家对此的解读也非常直白。
国家数据发展研究院院长胡坚波点明了核心:这份方案实际上是围绕数据集建设的全链条作出系统部署。它聚焦科学研究、工业制造、低空经济、具身智能等重点及创新领域,有针对性地“按需建库”,同时推动数据标注行业的转型升级。最终目标,是要全面提升数据供给能力与水平。
