首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
国产AI自主开发全球首个自研人工智能系统

国产AI自主开发全球首个自研人工智能系统

热心网友
35
转载
2026-05-26

造AI这件事,如今的主角,正在悄然变成AI本身。

就在最近,一个国产AI完成了一次堪称“自举”的突破:它先为自己写出了一套全新的大模型预训练框架,然后,就用这套框架,成功训练出了一个全新的小尺寸模型。

这个来自面壁智能的成果,带来了两个关键产物:由AI编写的预训练框架ForgeTrain,以及由它训练出的新模型MiniCPM5-1B

ForgeTrain的意义在于,它是全球首个完全由AI编写的、可用于实际生产的预训练框架。更令人惊讶的是,其性能在同等条件下,甚至超越了英伟达的标杆框架Megatron。具体到华&为昇腾平台上,用它来预训练MiniCPM5-1B,相比昇腾原生框架还能获得约10%的加速。

这背后,其实是一套名为Forge Engineering的新软件编程范式在支撑。其核心理念很直接:既然AI写代码的成本越来越低,未来的软件为何一定要做成庞大而通用的框架?完全可以针对特定的模型、硬件和任务,现场“锻造”出一套专用、极致的代码。

而被这套“AI工厂”产出的“产品”,就是MiniCPM5-1B模型。三者的关系,可以用下面这张图清晰地展示:

过去,“AI制造AI”更多是停留在概念或特定环节,比如生成一段函数、修改脚本或调整参数。但这一次,中国团队首次将这个概念,推进到了拥有可展示、可评测、可复现的完整工程样本阶段。

AI造出来的AI,能干啥?

最直接的问题来了:这个由AI“孕育”出的模型,究竟能做什么?

一个非常直观的应用场景是桌宠。这个仅有10亿参数的小模型,可以常驻在你的电脑桌面,变成一个随时响应、能聊天的AI伙伴。它不仅能根据上下文自然接话,还能被赋予不同的人格设定。

关键在于,它并非必须依赖云端大模型服务。1B的规模意味着它足够轻量,部署门槛大大降低。根据官方数据,MiniCPM5-1B在FP16精度下权重约2GB,适合GPU、高端笔记本和服务器;量化到INT4精度后仅约0.5GB,足以在手机、平板甚至车机等端侧设备上运行。

它的目标很明确:证明小模型也能很“能打”。在综合知识、数学推理、代码生成、工具调用等多个核心能力维度上,MiniCPM5-1B都拿出了与同尺寸端侧模型对比的亮眼成绩。

在公开评测中,其综合表现不俗。尤其值得一提的是,它再次刷新了小模型的“智能密度”上限。仅凭1B参数,就在国际知名的AA-Index榜单上超越了所有20亿参数以下的模型。相比三个月前发布的Qwen3.5-2B,MiniCPM5-1B不仅效果更优,参数量还减少了一半。

这指向一个越来越清晰的趋势:模型能力的提升,不再单纯依赖于参数的堆砌。更小的模型,正在承载更高的智能密度。数据显示,大模型的智能密度正以大约每3.5个月翻一番的速度持续提升。

因此,MiniCPM5-1B的价值在于,它不仅仅是一个小模型,更是在参数规模、部署成本和实际能力之间找到了一个新的平衡点,为端侧智能提供了更优解。

此外,它的自定义人格能力在端侧场景下意义重大。由于模型直接部署在本地,离用户更近,它可以更自然地记住用户的交互偏好,并根据不同场景切换风格,成为一个真正个性化的轻量级智能入口。

要让大模型从云端真正走向每个人的设备,模型本身必须足够小、成本足够低、体验足够好,并且拥有完整的工具链。这也正是MiniCPM5-1B强调开发者友好的原因。它提供了从模型、推理到微调的完整工具链支持,兼容SGLang、vLLM、llama.cpp、Ollama等多种主流推理框架,以及LLaMA-Factory等微调工具。

对开发者而言,这比单纯提供一个模型权重文件重要得多。因为一个模型能否被广泛应用,往往不只取决于其性能,更取决于部署、推理、量化、微调乃至接入工作流的便捷程度。

超越英伟达Megatron的“AI工厂”

如果说MiniCPM5-1B是“AI制造AI”的产品,那么ForgeTrain就是生产它的“工厂”。而这个工厂本身,也是AI建造的。

面壁智能将“AI制造AI”的进程划分为L1到L5五个阶段:

  • L1:AI仅提供建议,人类执行所有操作(如GitHub Copilot)。
  • L2:AI辅助研发,完成具体编码环节(如Cursor,Claude Code)。
  • L3:AI端到端产出下一代模型(代表:ForgeTrain)。
  • L4:AI递归自改进,改造训练管线和自身。
  • L5:AI自主设定研究议程,进行开放式探索。

ForgeTrain正对应着L3向L4过渡的阶段。它虽然还未达到AI自主发明下一代Transformer架构的程度,但已经深入到了大模型研发最核心的基础设施层——预训练框架。

过去,全球主流的大模型预训练框架,如英伟达的Megatron、Meta的Fairseq、谷歌的TensorFlow,无一不是由人类工程师一行行代码精心构筑而成。

而Forge Engineering范式提出了一个截然不同的思路。传统软件工程追求通用框架,力求一套代码适配多种场景,好处是复用性强,但代价是很难在每个具体场景都做到极致优化,就像一件均码的衣服,谁都能穿,却很难合身。

Forge Engineering则激进得多:既然AI写代码又快又便宜,为何还要执着于通用?完全可以为不同的模型、不同的硬件、不同的任务,量身定制专用的代码。这好比从工业化批量生产,回归到了高级定制。AI就是那个不知疲倦的顶级工匠,为每一个需求锻造最合身的“铠甲”。

但让AI自己编写预训练框架,难点远不止于生成代码。更关键的是:它如何知道自己写对了?如何确保速度足够快?如何验证显存、并行、通信、稳定性等复杂问题?

这就需要引入Harness(测试套件)的概念。可以把Harness理解为一个“考场”,AI在其中自动进行“生成代码-运行测试-获取反馈-迭代修改”的循环,整个过程无需人工干预。

面壁智能采用了一套三阶段构建方法论:首先,从现有框架中采集关键数据,形成评测标准和Harness;其次,构建出与参考实现二进制一致的预训练框架版本;最后,解除一致性限制,迭代优化直至超越原版。

最终成果就是ForgeTrain:它在功能上完全对齐英伟达Megatron,同时在相同硬件条件下,训练速度还能再快10%。这意味着,使用相同的算力,可以节省10%的训练时间和成本。

一场正在发生的行业剧变

这不仅仅是一场酷炫的技术演示。透过现象看本质,面壁智能的这次发布,揭示了大模型行业正在经历的深刻变革。

首先,竞争焦点正从“堆资源”转向“提效率”。

过去几年,行业比拼的是参数规模、数据量和算力集群,信奉“大力出奇迹”。但这条Scaling Law的道路存在物理和经济的上限。当堆料接近天花板,接下来的胜负手必然是效率。在相同的算力预算下,谁能实现更快的研发迭代、更短的代际周期?AI制造AI给出了答案:用AI替代人类研发管线中的重复性劳动,将数周的开发工作压缩到几十分钟。这是对抗资源瓶颈,让模型能力持续指数级攀升的关键解法。

其次,AI研究员的角色正在被重新定义。

在ForgeTrain这样的体系中,人类的角色从“Human in the loop”(在循环中执行具体任务)转变为“Human on the loop”(在循环外进行监督与顶层设计)。未来的AI科学家,可能不再需要亲自编写海量的底层算子和通信逻辑。他们将更多地扮演研发系统架构师和目标定义者的角色,只需设定好目标、搭建好测试环境,剩下的“脏活累活”交由不知疲倦的AI去完成。

最后,这为国产大模型与芯片生态提供了弯道超车的契机。

过去评价国产大模型,目光常局限于参数大小和榜单分数。但真正决定长期竞争力的,是底层“生产模型的能力”。谁能以更低的成本、更快的速度训练和试错,谁就能在激烈的竞争中存活下来。

更深远的战略意义在于国产算力生态。众所周知,华&为昇腾等国产芯片在硬件算力上追赶迅速,但最大的短板在于软件生态。英伟达CUDA生态积累了数百万开发者十余年的优化经验,这是靠人力难以短期逾越的鸿沟。

而ForgeTrain提供了一种破局思路:如果人力不足,就用AI来补!通过AI自动生成适配各种新模型、新硬件的专属框架,国产芯片有望借助AI的生产力,极大缩短软件生态的追赶时间。

当AI学会了制造AI,齿轮便已开始加速转动。一个由AI驱动AI研发的新纪元,正在我们眼前展开。

来源:https://www.qbitai.com/2026/05/425511.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

国产AI自主开发全球首个自研人工智能系统
AI资讯
国产AI自主开发全球首个自研人工智能系统

造AI这件事,如今的主角,正在悄然变成AI本身。 就在最近,一个国产AI完成了一次堪称“自举”的突破:它先为自己写出了一套全新的大模型预训练框架,然后,就用这套框架,成功训练出了一个全新的小尺寸模型。 这个来自面壁智能的成果,带来了两个关键产物:由AI编写的预训练框架ForgeTrain,以及由它训

热心网友
05.26
国产AI领跑加密货币投资 六大智能体如何布局数字资产
web3.0
国产AI领跑加密货币投资 六大智能体如何布局数字资产

六大AI加密货币投资竞赛深度解析:国产模型为何表现卓越? 2025年10月,一场别开生面的加密货币投资竞赛引发行业关注。六大顶尖人工智能模型同台竞技,旨在测试其在数字资产市场中的实战投资能力。最终,国产AI模型DeepSeek以显著优势拔得头筹,其表现远超多个国际知名模型,这一结果为我们揭示了AI金

热心网友
05.24
国产AI销售陪练系统哪家好主流厂商与标杆产品解析
业界动态
国产AI销售陪练系统哪家好主流厂商与标杆产品解析

数字化转型背景下,AI销售陪练系统正成为破解传统培训成本高、周期长难题的关键工具。市场厂商主要分为内容、渠道、垂直及技术四类,系统可应用于新人实训、合规演练等场景,有效提升效率、降低风险。选型应聚焦技术成熟度、行业知识及交付能力,以驱动培训体系战略升级。

热心网友
05.24
国产AI音乐工具崛起企业为何放弃Suno选择它
AI资讯
国产AI音乐工具崛起企业为何放弃Suno选择它

AI音乐行业正出现从Suno向Mureka的迁移趋势。Mureka凭借V8、V9模型在人声质量、音乐完成度及中文适配上的提升,提供更稳定专业的解决方案,并以其直连服务、合规稳定等优势吸引了Sondo、快歌等头部平台,支持其业务增长与出海。企业决策注重模型效果,更看重无缝集成工作流与可靠支持。

热心网友
05.11
​国产AI视觉大模型集体“反超”,豆包力压谷歌拿下全球第一
业界动态
​国产AI视觉大模型集体“反超”,豆包力压谷歌拿下全球第一

中文视觉大模型洗牌:豆包斩获总榜第一 国内模型全面反超海外 最近一份来自SuperCLUE-VLM的评测报告,在圈内引起了不小关注。这份2026年4月的最新报告揭示了一个关键趋势:中文多模态视觉语言模型的竞争格局,正在发生结构性变动。在对全球17款主流大模型进行深度横评后,结果相当明确——国产AI阵

热心网友
04.29

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

和平精英丢雷轨迹线设置教程 手雷抛物线开启方法
游戏资讯
和平精英丢雷轨迹线设置教程 手雷抛物线开启方法

在《和平精英》的激烈对决中,手雷不仅是范围杀伤武器,更是扭转战局、攻破敌阵的核心战术道具。许多玩家都曾遇到过手雷扔不准、错失良机的困扰。其实,游戏内自带了一个能极大提升投掷命中率的实用功能——丢雷轨迹线。这项功能无需在外部设置菜单中预先开启,其所有操作都集成在实战投掷界面中,关键在于对局时的灵活调用

热心网友
05.26
2026 ASCO年会中国创新药企多项重磅研究亮相
科技数码
2026 ASCO年会中国创新药企多项重磅研究亮相

2026年5月29日至6月2日,全球肿瘤学界的年度盛典——美国临床肿瘤学会(ASCO)年会将于芝加哥隆重举行。作为肿瘤领域最具影响力的国际学术会议,ASCO年会始终是前沿科研突破的风向标和临床治疗理念的策源地。本届大会,中国创新力量的表现格外引人瞩目:由中国学者主导并入选口头报告、快速口头报告等核心

热心网友
05.26
EverMail AI 人工智能邮件助手使用指南
AI教程
EverMail AI 人工智能邮件助手使用指南

EverMail AI是什么 在邮件营销的实际工作中,营销人员常常面临两难选择:使用模板群发效率高但缺乏个性,手动撰写又耗时耗力。如何实现大规模个性化沟通,是提升转化率的关键。EverMail AI正是为解决这一核心痛点而生的智能解决方案。 简单来说,EverMail AI是一款基于人工智能技术的电

热心网友
05.26
OKX欧易官方App最新版下载 安全获取手机端正版安装包
web3.0
OKX欧易官方App最新版下载 安全获取手机端正版安装包

OKX欧易:全球领先的数字资产服务平台 在数字资产的世界里,选择一个可靠、功能全面的交易平台,无疑是开启旅程的第一步。OKX欧易,正是这样一个备受全球用户信赖的数字资产服务平台。它集成了比特币(BTC)、以太坊(ETH)、狗狗币(DOGE)等主流数字资产的交易服务,凭借其强大的功能、清晰友好的用户界

热心网友
05.26
和平精英奥特蛋作用与效果详解 获取方法及实战用途解析
游戏资讯
和平精英奥特蛋作用与效果详解 获取方法及实战用途解析

《和平精英》全新推出的“奥特精英和平蛋”活动,已成为近期玩家热议的焦点。该活动为玩家提供了一个获取“荣耀勋章”的全新途径,而勋章正是抽取奥特曼主题限定奖励的关键道具。奖池内包含终极赛罗飞行器、多款人气角色套装及枪械皮肤等珍稀物品,对于奥特曼系列爱好者与皮肤收藏家来说,这是一次极具吸引力的机会。 奥特

热心网友
05.26