上海开源万亿参数AI模型:从解理论题到攻克科研难题

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

4日晚间,上海人工智能实验室宣布,开源全球首个基于“通专融合”架构的万亿参数科学多模态大模型——Intern(书生)-S1-Pro。这是全球开源社区中参数规模最大的科学模型,其性能表现稳居全球第一梯队,为AI for Science从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供创新的系统性开源基座。
值得一提的是,书生万亿科学大模型验证了从原创模型架构到国产算力基座自主技术的完整链路。通过开源开放,书生万亿科学大模型旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命。
创新底层架构:突破万亿参数科学模型边界
上海人工智能实验室主任、首席科学家周伯文提出:可深度专业化通用模型是实现AGI的可行路径,其关键挑战在于:专家化模型在训练过程中需要低成本、能规模化的密集反馈;能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力;并能引入对物理世界规律的考量,兼顾多项差异化能力的学习效率与性能。
资料图:上海人工智能实验室主任、首席科学家周伯文 摄影:陶磊
新民晚报记者了解到,此次发布的书生万亿科学大模型通过多项SAGE基础模型层的技术创新,拓宽了模型应用边界、提升了超大规模训练可行性,推进了可深度专业化通用模型的探索。
为构建能更深层次理解物理世界规律的科学大模型,研究团队引入了傅里叶位置编码(FoPE)并重构时序编码器。FoPE为AI赋予双重视角:既能像看“粒子”一样捕捉文字之间的相对距离,又能像分析“波”一样把握科学信号的整体规律与频率。
研究团队还革新了内部的“路由机制”。传统方法存在训练低效和算力浪费两大痛点,新技术通过“路由稠密估计”,让模型在高效运行的同时能进行更充分的学习,提升了稳定性;进而通过“分组路由”策略,像智能交通系统一样使海量计算芯片实现负载均衡,避免了资源闲置。
“书生万亿科学大模型不仅在规模上刷新了科学多模态模型的参数规模上限,也为SAGE架构所提出的‘通用能力与专业能力协同演进’提供了可落地的实现路径。”上海AI实验室科研人员表示。

书生万亿科学大模型在评测基准中的表现:通用能力表现出色,科学能力达国际领先水平
科学能力再进化,通用能力协同演进
得益于创新的底层架构设计与万亿参数超大规模训练策略,书生万亿科学大模型的科学能力进一步升级。
在国际数学奥林匹克(IMO-Answer-Bench)和国际物理奥林匹克(IPhO2025)两大权威基准测试中,书生万亿科学大模型均展现出竞赛级别的解题能力。
而在AI for Science关键垂类领域,书生万亿科学大模型成功构建了一个跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,不仅单学科成绩优异,更是在SciReasoner等高难度的综合学科评测基准中,取得了与顶尖的闭源商业大模型相当,甚至更优的成绩,稳居第一梯队。
新民晚报记者获悉,在基础理解维度,书生万亿科学大模型能够精准解析复杂的分子结构图及各类实验图表;深入到逻辑推理层面,书生万亿科学大模型能够处理高阶科学问答,如反应条件推断、理化性质预测,精准捕捉数据背后的因果规律等。
随着理解与推理能力的持续增强,书生万亿科学大模型的能力边界不断向真实科研场景延伸,其应用范围从微观层面的化学逆合成、蛋白质序列生成,拓展至宏观尺度的遥感图像分析等复杂任务。
“模型正展现出从‘解题’迈向‘解决问题’的科研生产力价值,为前沿科学探索提供了坚实支撑。”科研人员透露。
筑牢“算力—算法”一体化基座
在规模、性能提升的同时,书生万亿科学大模型构建了原创的“算力—算法”一体化基座。模型从架构设计之初,便与昇腾计算生态确立联合研发路线,实现了从最底层的算子、编译优化到上层的训练、推理框架的深度全栈适配。此外,它还与沐曦联合研发利用模型加速算子适配。

值得一提的是,自2024年书生大模型首次发布以来,上海AI实验室已逐步构建起丰富的书生大模型家族,包括科学多模态模型、大语言模型书生·浦语、多模态模型书生·万象、强推理模型书生·思客等;同时首创并开源了面向大模型研发与应用的全链路开源工具体系,覆盖数据处理、预训练、微调、部署、评测与应用等关键环节,形成覆盖数十万开发者参与的活跃开源社区。
自发布以来,科学多模态模型多次登顶HuggingFace全球多模态榜单,累计下载超41万次,并获得近200家科研机构和企业的合作申请。其卓越的跨模态科学理解能力不仅为科研提供了高效工具,也通过开源降低了全球科研团队迈入AGI for Science的门槛。
原标题:《从“解题”到“解决问题”!上海开源万亿参数科学大模型,AI成为科研合伙人》
栏目编辑:马丹
相关攻略
2026年5月8日至10日,备受瞩目的第28届中国北京国际科技产业博览会(简称北京科博会)在北京国家会议中心隆重举行。本届科博会以“科技引领·创享未来”为核心主题,特别强化了“人工智能+”行动的驱动作用。展会现场,信息技术、医药健康、智能制造、绿色双碳、科技金融、区域创新等六大主题展区亮点纷呈。同期
2026年5月17日,第八届搜狐科技年度论坛将于北京隆重举行。自创立以来,论坛议题从5G与人工智能的早期探索,不断演进为连接科学前沿与产业创新的核心思想平台,影响力持续扩大。本届论坛汇聚近三十位科学界、学术界及产业界的领军人物,他们的对话将既深入宇宙与数学的纯粹真理,也直面人工智能浪潮下的现实挑战,
腾讯近期增持游戏科学股份至24%,成为其唯一外部投资方。此次增持分两步完成,腾讯承诺尊重团队自主权,公司保持独立运营。游戏科学由原《斗战神》核心成员创立,其作品《黑神话:悟空》发售三天销量突破千万套。创始人冯骥仍为第一大股东,腾讯作为战略投资者预示双方将深化合作。
“在复旦大学建设世界顶尖的交叉学科研究平台,让充满探索乐趣的基础科学真正推动人类健康进步”——这是舒校坤教授全职回归母校复旦时立下的目标,也是他二十多年科研生涯最真实的写照。 “科学研究本身就是一件充满乐趣的事。”舒校坤教授常常强调这一点。他认为,科研最大的动力,来自于对未知世界纯粹的好奇与探索欲。
我是一个爱听歌的人 对于爱听歌的人来说,耳机突然不见了,这事儿可真够让人着急的。尤其我那副耳机,接口还有点特别,用的是现在不太常见的D型充电口。翻箱倒柜折腾了半天,还是一无所获,心里难免空落落的。看着手边几副闲置的普通耳机和充电器,一个念头突然冒了出来——为什么不自己动手,做一个呢? 说干就干。我挑
热门专题
热门推荐
当RPA机器人面临复杂决策场景时,企业通常可以采取以下几种经过验证的有效策略来应对,确保自动化流程的顺畅与准确。 借助人工智能技术 一种广泛应用的解决方案是将RPA与人工智能技术深度融合,特别是机器学习与自然语言处理。通过集成AI的预测分析与模式识别能力,RPA能够处理非结构化数据并应对模糊的业务情
当智能制造与人工智能技术深度融合,这不仅是两种前沿科技的简单叠加,更是一场旨在重塑全球制造业竞争格局的系统性变革。其核心目标在于,通过深度嵌入人工智能等前沿技术,全面提升制造业的智能化水平、生产效率与国际竞争力。那么,如何有效推进这场深度融合?以下六大关键策略构成了清晰的行动路线图。 1 加强关键
对于已经部署了RPA的企业而言,项目上线远不是终点。要让自动化投资持续产生价值,对机器人性能进行持续优化是关键。这就像保养一台精密的机器,定期维护和调校,才能确保其长期高效、稳定地运行。 那么,具体可以从哪些方面着手呢?以下是一些经过验证的优化方向。 一、并行处理与任务分解 首先,看看任务执行本身。
面对海量数据源的高效抓取需求,分布式数据采集架构已成为业界公认的核心解决方案。该架构通过精巧的设计,协调多个采集节点并行工作,并将数据汇聚至中央处理单元,最终实现数据的集中分析与深度洞察。这套系统看似复杂,但其核心原理可拆解为几个关键组件的协同运作。 一、系统核心组成 一套典型的分布式数据采集系统,
Gate io平台活动页面多样,新手易混淆注册奖励、邀请与正常开户页。本文梳理三者核心区别:注册奖励页通常含专属链接与限时福利;邀请页强调社交分享与返利机制;正常开户页则提供基础功能与安全验证。清晰辨识有助于用户高效参与活动,避免错过权益或操作失误,提升在Web3领域的入门体验。





