据IT之家2月4日消息,上海AI实验室于今日(2月4日)宣布,开源基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型Intern-S1-Pro。

上海AI实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro的核心科学能力实现了跃升。其在AI4S领域的高难度综合学科测评中,表现稳居国际领先水平;其复杂数理逻辑推理能力达到了奥赛金牌水准。面向真实科研流程的智能体能力,则位居开源模型的第一梯队。

该模型基于混合专家架构,共拥有512个专家,总参数量达1T,而每次调用仅激活8位专家、22B参数。其通用能力和科学能力实现了协同演进,并在底层架构上实现两大核心突破:
在SAGE的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;通过高效路由机制,系统攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。
与此同时,Intern-S1-Pro验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的AGI4S基础设施奠定了底座。
附Intern-S1-Pro开源资源如下:
在线体验
GitHub
HuggingFace
ModelScope
