在2025国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料3.0版本重磅发布。该版本数据规模突破120GB,必将为大模型训练和技术研发注入新动能。

这一标志性成果的诞生,源自中央网信办牵头规划,中国网络空间安全协会联合国家互联网应急中心等多家权威单位共同推进。项目凝聚产学研各界智慧,依托人工智能安全治理专委会搭建的协作平台,实现了跨领域资源的高效整合。
语料库获取现已对外开放,用户可访问中国网络空间安全协会旗下的"中文互联网语料资源平台",完成实名注册后即可获取各类专业语料资源。项目负责人强调,3.0版本的发布标志着中文数据资源体系建设取得重大突破,团队将持续优化数据质量,为AI技术创新和产业升级保驾护航。
中文互联网基础语料3.0不仅丰富了人工智能领域的数据资源,更重要的是提供了更精准、更全面的研究素材,这将有力推动行业技术水平和应用能力全面提升。
