AI赋能科学发现:如何突破数据壁垒攻克研究难关
人工智能正在与科学研究实现深度交融,重塑着科学未来的面貌。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
去年11月,美国启动了一项名为“创世纪计划”的国家级战略,旨在整合其顶尖的超算资源与独特的数据资产,利用人工智能变革科研范式,加速科学发现进程。无独有偶,英国同期也发布了其AI for Science战略,规划了15项具体行动,以巩固其在人工智能驱动科学突破领域的全球领导地位。
近日,多位青年科学家在上海的一场AI for Science座谈会上不约而同地指出,数据壁垒已成为该领域发展的核心痛点之一。人工智能不仅需要海量数据,更需要多样化的高质量数据。缺少足够的数据“原料”,就如同巧妇难为无米之炊,难以训练出有效的模型。AI for Science的征程亦不应止步于科研发现,而应选择那些兼具产业基础、技术优势和数据积累的领域先行先试,探索从研究到应用的市场闭环。
没有数据“下锅”,就难以炼出好模型。
新能源汽车已成为我国经济发展的重要引擎,而锂电池是当前的主流技术路线。固态电池作为下一代电池技术的突破方向之一,采用固体电解质替代传统液态或凝胶电解液,具有高能量密度和高安全性的显著优势。
上海交通大学副教授、未来电池研究中心执行主任万佳雨长期从事固态电解质研发。他坦言,尽管当前新材料层出不穷,但在固态电池领域,真正有应用前景的材料不过十余种,若按大类划分仅有寥寥几类。“在模型训练中,如果没有足够的数据‘下锅’,就难以训练出一个好模型。”
在生物领域,蛋白质是生物制造的底层材料。过去,开发一款成功的蛋白质产品高度依赖科学家经验,过程漫长且试错成本高昂,成功率偏低。由于蛋白质研发设计技术门槛高,导致优质供给不足,国际垄断现象严重,我国尤其面临着工业酶70%依赖进口的困境。利用AI高效设计蛋白质,关键在于攻克蛋白质功能预测难题,而数据则是重中之重。
“人工智能需要数据,不仅要求数据量大,而且要求数据的差异化程度高。上海交通大学特聘教授、天鹜科技首席科学家洪亮团队开发了AI蛋白质设计平台Venus。他们让大模型学习极端工况下的蛋白质功能,并以此辅助蛋白质设计,进而开发出全球首款由大模型设计且实现工业化生产的蛋白质。”洪亮解释道,这一策略的成功,完全依赖于底层数据的规模与质量。
为了解决数据问题,洪亮团队组建了全球最大的蛋白质数据库,收录了150亿条蛋白质序列,其中包含67亿条私有数据,既有来自马里亚纳海沟的深海蛋白质数据,也有中国大西北盐湖的蛋白质数据。
“我们在数据层面遇到的核心痛点并非数据获取难,而在于数据高度非标准化。”洪亮表示,各方提供的数据格式各异,缺乏统一规范。为了清洗每一条序列并进行标准化标注,团队为65亿条蛋白质数据打上环境标签,才将原始的“杂乱”数据转化为可用的研究数据。
协同合作打破数据壁垒,探索市场闭环
数据采集、专业的标注与数据共享,是推进AI for Science不可或缺的关键要素。
“许多科学领域的专业数据并不公开,也缺少团队投入资源去完成那些繁琐的数据加工工作,但AI for Science的数据必须共享。”上海科学智能研究院副院长程远介绍,该院旗下的星河启智科学智能开放平台的数据广场已建成超过4万个高质量科学数据集,数据总量达12PB。
上海科学智能研究院的经验是构建多层次的人才体系:20多位专职数据工程师从事数据加工和批量化处理,200多位在校学生和聘用人员专职从事数据标注,1000多位众包人员承担数据校验和初级标注。除了丰富的科学语料资源和海量数据储备,平台的数据加工工具确保了数据质量和科研可用性,明晰的数据权属机制则推动了数据合规生产和开放共享。“我们与高校、企业合作,加工和开放了16个领域的专业数据。他们既是平台使用者,也是建设者,贡献了数据和模型。”程远说。
去年9月,上海人工智能实验室联合合肥实验室、临港实验室等12家国家实验室成立了上海科学智能战略科技力量联盟,同时吸引众多高校和科研机构加入,共同梳理联盟体系内的各学科数据,以打破数据壁垒。
上海人工智能实验室青年科学家、科学智能中心负责人白磊认为,要推动AI for Science取得实质进展,首先必须清晰界定人工智能,特别是通用人工智能(AGI)在科学领域的能力表现,系统解析不同学科和科研流程对AI能力的差异化需求,摒弃“胡子眉毛一把抓”的做法。与此同时,AI for Science在模型训练阶段投入巨大,海量数据整合与算力支撑必然要求集结更广泛的力量协同攻关,加强合作。
人工智能的赋能也不应止步于科学发现。上海大学材料基因组工程研究院副教授高兆和表示,AI for Science要从科学研究落地工程,实现从研究到产业的贯通,否则任何技术突破都只是昙花一现。
在洪亮看来,AI for Science的发展有其客观规律,不同学科的商业化程度、数据积累和技术能力各不相同,应当选择兼具产业基础、技术优势和数据积累的领域先行先试,建立以智能体为核心的科研生态,探索从研究到应用的市场闭环。AI for Science的可持续发展必然依托于强大的生态系统,要通过生态链接,有效承接技术与需求,释放AI设计能力。在这一过程中,政府的角色应是引导、搭台、共建,待模式成熟后逐步有序退出。
相关攻略
两说作为战略性新兴产业,低空经济坐拥万亿级赛道的发展空间,备受瞩目。而人工智能技术正从感知、决策、协同、调度到监管,全链条重构其发展逻辑,成为推动低空经济从试点探索迈向规模化商用的核心引擎。在人工智
两说 Business Insights当前,低空经济以其战略性新兴产业与万亿级赛道的发展空间而备受关注,人工智能技术正从感知、决策、协同、调度、监管全链条重构低空经济发展逻辑,成为低空经济从试点
【文 观察者网 心智观察所】 最近,NeurIPS——人工智能领域最具影响力的学术会议之一——在2026年征稿规则中新增了一项条款:凡被美国财政部海外资产控制办公室(OFAC)列入制裁名单的机构,
人民网北京3月30日电 (记者赵竹青)当高端科学仪器被AI赋能,会发生什么?3月27日,2026中关村论坛年会AI for Science(人工智能赋能科学研究)青年论坛上发布的我国首套智能双束电镜
来源:海外网03:41机器人“灵巧手”能独立穿针引线,亦可弹琴奏乐;智能眼镜将语音转为字幕、总结成提纲,帮助人们实现高效交流;脑机接口、外骨骼突破技术瓶颈,助力残障人士恢复手部运动,甚至举起哑铃
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





