首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
成都人工智能数据工坊:高质量数据集炼金生态正式启动

成都人工智能数据工坊:高质量数据集炼金生态正式启动

热心网友
42
转载
2026-01-17

1月16日,由成都传媒产业集团旗下红星传媒联合中国人工智能产业发展联盟数据委员会主办的第三届“大模型 大未来”人工智能大模型基准测试发展大会暨人工智能高质量数据集炼金工坊生态行在成都高新区举办。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

作为大会的重要环节,“人工智能高质量数据集炼金工坊生态行”首站活动于当天下午同步开展。中国电信、海天瑞声、四川长虹等多家企业代表齐聚现场,分享各自在高质量数据集和数据标注建设方面的实践成果,为行业提供宝贵经验。

当天下午,中国信通院人工智能研究所、中国信通院成渝分院、文心大模型数据生态中心、四川长虹、天津大学、海天瑞声、中国电信成都分公司、砺英数智8家单位携手,宣布启动“四川数据标注和数据质量评估能力共建计划”,该计划将汇聚各方力量,为大模型产业高质量发展注入强劲动能。


“生态行”落地成都,探索数据赋能路径

如果说大模型是人工智能产业的“核心引擎”,那么高质量数据集就是驱动引擎持续运转的“燃料与基石”。“高质量数据集炼金工坊”生态计划依托于中国人工智能产业发展联盟,由中国信息通信研究院人工智能研究所牵头,联合中国国家图书馆、高等教育出版社、中国科学院文献情报中心等多家单位共同发起。

作为西部重要的数字经济和人工智能产业集聚地,成都在数据资源管理、应用场景培育和产业生态建设方面具备良好基础。此次“生态行”落地成都,既是对区域数据要素发展实践的集中展示,也旨在通过跨区域、跨主体的交流协作,探索可复制、可推广的数据赋能路径,为大模型产业高质量发展夯实数据根基。

在“生态行”首站活动现场,中国人工智能产业发展联盟数据委员会主任、中国信通院人工智能研究所平台部副主任李荪在致辞中表示,人工智能高质量数据集从国家正式提出相应的概念,到现在大概一年多时间。整个高质量数据集在各地以及各行各业已经引起了强大的反响,成都也是国家的七大数据标注基地之一。希望让更多行业“沉淀在地下的黄金”,变成“流动的黄金”,通过人工智能炼金工坊的生态活动,极大地推动数据要素价值的更快释放,以及人工智能的快速应用落地。


模型的卓越能力源于优质数据的喂养,产业的高质量发展离不开坚实数据基础的支撑。四川省大数据发展研究会副会长、秘书长秦强子在致辞中表示,四川省大数据发展研究会凝聚了288家会员单位,联动超过3900家生态数据企业,超过3万名数据选手资源,初步构建了协同发展的良好生态。我们的核心业务紧紧围绕数字经济发展的关键环节展开,其中“三赛一行”成为服务数据产业创新,挖掘培育人才,促进数据要素流通的特色品牌与重要抓手。

“炼金”高质量数据集,专家分享前沿实践与思考

天津大学计算机科学与技术学院教授、深圳河套学院双聘教授、天津大学“语言智能与技术”中外联合研究中心主任熊德意在主题分享中表示,大模型首先是大量的数据,加上算法和算力,然后把模型炼成智能,再去完成任务。大量的数据、海量的数据,但是这个量不等于数据的“智”,所以我们国家要建高质量数据集。怎么样找到高质量数据集,这是在模型、在应用当中很重要的一个瓶颈问题。最近工信部提出了“模数共振”,引导人工智能模型与高质量数据集协同创新、深度融合。

中国信通院人工智能研究所专家樊威在主题分享中作出预判:2026年有四类数据集会爆发,一是世界模型的数据需求,像World Score里面有3000个样本涵盖静动态及室内外等多种场景;二是具身智能的数据需求,也就是真实世界机器人数据和仿真合成数据;三是智能体的数据需求,它需要的是与测试环境深度耦合的交互数据;四是行业模型数据需求,未来是三措并举来推动高质量数据集建设,包括数据工厂、体系建设、开发维护、合规可控等。


中国电信成都分公司高级工程师、大数据和AI中心副总经理罗莉表示,人工智能到哪儿,数据标注就到哪儿。中国电信在“采存管用、标训推测”这八个方面都有着全链条的智能处理能力,特别是多数据、多模型、多算力等方面的协同能力有很大的提升。

文心大模型数据生态中心负责人黄能表示,目前正处在人工智能技术革命的第四个阶段,从逻辑的推理到知识的推理,到深度学习为主的,包括向视觉、语义识别等等的技术,今天处在第四个浪潮,就是生成式的人工智能。目前通用人工智能技术和多模态融合还处在蓬勃的发展期,我们也看到未来的机会,尤其是AI的应用马上会到一个很好的爬坡期,然后也会涌现出非常多的商业模式。

四川长虹云计算与大数据研究中心副总经理唐博表示,早期企业做信息化的时候,很多数据集成主要围绕业务场景,需要相应的定制化开发,但这会导致“数据孤岛”的问题。因此我们提出了数据中台、数据湖、数据汇聚的概念。但也带来新问题,先汇聚、后应用的方式会导致数据跟应用场景之间的匹配很难掌握,而且大量数据在没有被应用的情况下就汇聚上来,汇聚的成本很高,存储的成本也很高。唐博认为,人工智能高质量数据集有五个特色:规模大、安全牢、观点正、效果好、应用广。

北京海天瑞声科技股份有限公司首席专家王淳表示,从我们自己的生产过程来看,感觉今天的很多大模型多多少少存在一点缺陷,比如反馈不够精准,不够及时,不够严谨,甚至有个别的地方是不够准确的。我们从客户的需求能够感觉到一些行业诉求的变化,比如以前从单纯的单模态数据需求,到今天需要多模态需求;以前是通用场景的需求,到今天行业场景的需求。最近就有包括工业、医疗、农业、林业、水利等等很多的需求,还没有相应的知识储备,但都已经在我们的需求清单了。


砺英数智(北京)数据技术有限公司总经理李图龙表示,传统的数据中台解决了“数据汇聚”,却没有解决“数据怎么用”的问题。他分享到,当前面向大模型应用,应以真实业务场景为牵引,通过规划设计、数据加工、模数共振训练、场景运维和数据运营这五个路径来实现高质量数据集建设。

红星新闻记者 李伟铭

来源:https://www.163.com/dy/article/KJGFUHMI051492T3.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”
科技数码
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”

想象一下这个场景: 你让 AI Agent 帮你修一个代码 Bug。它打开项目,读了 20 个文件,改了改,跑了一下测试,没过,又改,又跑,还是没过……来回折腾了十几轮,终于——还是没修好。 你关掉电脑,松了口气。然后收到了 API 账单。 上面的数字可能让你倒吸一口凉气——AI Agent 自主修

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026年加密货币交易所安全排名 十大靠谱交易平台防雷指南
web3.0
2026年加密货币交易所安全排名 十大靠谱交易平台防雷指南

进入2026年,加密货币市场的格局与安全标准已悄然进化。对于投资者而言,选择一个安全可靠的交易平台,其重要性丝毫不亚于挑选资产本身。毕竟,资产增值的前提,是它们得安然无恙地躺在你的账户里。今天,我们就来盘一盘当前市场上主流的虚拟资产交易所,从风控能力、资产储备与市场口碑等多个维度,做一次深入的“避雷

热心网友
05.14
2026年炒币软件排行榜:十大热门交易APP深度评测与推荐
web3.0
2026年炒币软件排行榜:十大热门交易APP深度评测与推荐

本文梳理了2026年备受关注的数字资产交易平台,从安全性、功能特色与用户体验等维度进行分析。重点探讨了主流合规平台在资产托管、交易深度上的优势,以及新兴聚合器在提升交易效率方面的创新。同时,也指出了选择平台时需关注的风险控制与合规性,为不同需求的用户提供参考方向。

热心网友
05.14
2026年十大炒币软件APP排行榜:安全靠谱的交易平台推荐
web3.0
2026年十大炒币软件APP排行榜:安全靠谱的交易平台推荐

本文汇总了2026年主流的数字资产交易平台,从安全性、功能特色、用户体验及合规性等维度进行分析。内容涵盖适合新手的综合性应用、面向专业交易者的工具型软件,以及注重资产安全的托管方案,旨在为用户选择合适平台提供客观参考,并提醒注意市场风险与自我资产保护。

热心网友
05.14
2026年最佳数字货币交易平台排名与官方下载指南
web3.0
2026年最佳数字货币交易平台排名与官方下载指南

本文梳理了2026年主流的数字资产交易平台,从安全性、交易体验、功能特色等维度进行分析。重点介绍了综合型头部平台、专注创新的新兴应用以及面向特定需求的专业工具,旨在为用户提供客观参考,帮助其根据自身情况选择合适的软件进行下载与使用。

热心网友
05.14
2026年十大最佳炒币软件APP排行 安全靠谱的交易平台推荐
web3.0
2026年十大最佳炒币软件APP排行 安全靠谱的交易平台推荐

本文探讨了2026年数字货币交易软件的选择标准,并列举了十款主流应用。内容涵盖安全性、交易对、用户体验及费用等核心考量维度,分析了不同平台在现货、合约及DeFi集成等方面的特色,旨在为不同层级的用户提供实用参考,帮助其根据自身需求做出合适选择。

热心网友
05.14