源3.0 Flash模型开源:基础大模型代码与方案全面开放
YuanLab.ai 团队正式宣布开源其 Yuan3.0 Flash 多模态基础大模型。此次发布不仅提供了完整的模型权重(支持16bit与4bit量化版本)、详尽的技术白皮书、全程训练方案及全面评测数据,更将全面开放社区后续微调、二次训练与垂直领域定制化开发权限。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据官方资料,Yuan3.0 Flash 是一款参数量达400亿的多模态基础模型。它基于稀疏混合专家(MoE)架构设计,其单次前向推理仅动态激活约37亿参数。该模型首次提出并落地强化学习优化范式 RAPO(反思感知策略优化),并创新引入反思抑制奖励机制(RIRM),从训练源头约束模型以减少多余反思行为。在保障甚至提升逻辑推理准确率的同时,显著削减推理阶段的 token 生成量,从而大幅压缩计算资源消耗,在“低算力开销、高智能水平”的大模型演进方向上实现了关键突破。
Yuan3.0 Flash 整体由三大部分构成:高性能视觉编码器、高效语言主干网络,以及鲁棒的多模态对齐模块。其中,语言主干采用局部过滤增强型注意力机制(LFA)与MoE结构协同设计,在提升注意力建模精度的基础上,有效缓解训练与推理过程中的显存压力与算力负担。
在多模态融合方面,模型通过视觉编码器将图像信息编码为统一语义token,与文本token共同输入语言主干,并借助多模态对齐模块完成跨模态特征的精准、稳定映射。此外,系统集成了自适应图像分块策略,既可支撑超高分辨率图像理解任务,又可显著降低GPU显存占用与整体计算开销。

官方公告指出,在面向企业级落地的关键任务中——包括RAG增强对话(ChatRAG)、多模态文档检索(Docmatix)、多模态表格解析(MMTab)以及智能摘要生成(SummEval)——Yuan3.0 Flash 的综合性能已超越 GPT-4,展现出更强的产业适配性与实用价值。
在权威多模态推理与纯语言理解评测中,Yuan3.0 Flash(40B)的精度表现逼近 Qwen3-VL(235B)与 DeepSeek-R1(671B)等超大规模模型,但其平均 token 消耗仅为上述模型的 1/4 至 1/2,为企业部署轻量高效的大模型解决方案提供了全新选择。


源 Yuan 3.0 系列基础模型将按能力与规模划分为 Flash、Pro 和 Ultra 三大版本,对应参数量分别为 40B、200B 与 1T,满足不同场景下的性能与成本需求。
源码获取地址:点击下载
热门专题
热门推荐
V社联合创始人G胖调整角色:从主导开发转向赋能团队,释放创意生产力 近期一则消息引发游戏行业广泛关注:Valve联合创始人加布·纽维尔(“G胖”)在公司内部进行了一次重要角色转型。此次调整的关键原因,与他个人在公司中的特殊影响力息息相关。根据透露,这位创始人决定减少在具体游戏开发工作中的直接深度参与
红魔姜超透露:全新游戏平板将于四月或五月发布,承诺带来惊艳体验 游戏硬件领域即将迎来重磅更新。努比亚红魔游戏手机的产品线负责人姜超,近日通过社交媒体进行了一次颇具悬念的“前瞻剧透”,成功引发了广大游戏玩家和科技爱好者的高度关注。他明确指出,红魔全新一代游戏平板的发布日期已锁定在四月或五月,并使用了“
金铲铲之战S17天煞羁绊:效果解析与实战应用 在《金铲铲之战》S17赛季中,【天煞】是一个定位独特的专属羁绊,仅由5费英雄“劫”所携带。激活这一羁绊需要特定的前置条件——玩家必须在强化符文选择阶段获得【入侵者劫】。一旦成功解锁,劫将获得全新的技能机制,从而在战局中发挥出颠覆性的作用。 金铲铲之战S1
索尼调整第一方工作室阵容,王牌重制团队蓝点工作室正式“退出”核心名单 近日,索尼在其PlayStation Studios官方网站的更新中做出了一项关键调整,引发了游戏玩家和行业观察者的广泛关注:曾凭借《恶魔之魂:重制版》等作品赢得盛誉的蓝点工作室,已不再出现在索尼核心第一方工作室的名单之中。此次页
未来人类X98W移动工作站正式发布:重新定义移动端专业性能的新标杆 在专业移动计算领域,总有一些产品能够打破常规认知。近日,未来人类(TerransForce)正式在其官网上线了全新的X98W高性能移动工作站,并宣布将于本月内全面发售。这款设备的问世,无疑为那些在移动办公环境中仍需要桌面级别强悍性能





