首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
英伟达H200次日报禁,智谱联手华为开源国产多模态模型

英伟达H200次日报禁,智谱联手华为开源国产多模态模型

热心网友
88
转载
2026-01-14

(文/陈济深 编辑/张广凯)

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

就在美国宣布解禁英伟达H200、试图重新抢占中国市场的微妙时刻,上市不到一周的智谱,反手给国产开源界抛下了一颗重磅炸弹。

今日,智谱宣布联合华为开源最新图像生成模型GLM-Image。

这不仅是行业内首个在国产芯片上完成全流程训练的SOTA多模态模型,也用实际案例向行业展示了一个客观现实:对于顶级模型而言,高端算力已不再是必须依赖进口的“卡脖子”命门。

GLM-Image模型采用自主创新的「自回归+扩散解码器」混合架构,实现了图像生成与语言模型的联合,并基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,验证了在国产全栈算力底座上训练前沿模型的可行性。

智谱最新介绍称,GLM-Image是其面向以Nano Banana Pro为代表的新一代「认知型生成」技术范式的一次重要探索。

观察者网实测后发现,作为一款由纯国产芯片完成全流程的多模态模型,GLM-Image不仅更加擅长中文的生成,在各类图片类型上均有着行业头部的表现,能够驾驭各种不同的画风和尺寸需求。这意味着国产算力不再只是“可用”的替代方案,而是真正进入了可规模训练、可持续迭代、并能支撑前沿模型能力演进的阶段。



受此影响,智谱今日股价大涨18%报收216港元,上市一周来股价较116.2港元发行价接近翻倍,市值一度突破千亿港元。

对标顶级模型

从实测样例可以看出,智谱这波主打的是长文本以及复杂视觉文字的生成任务。

在文字渲染的权威榜单上,GLM-Image 交出了一份相当亮眼的成绩单。不仅超越 Qwen-Image、Z-Image 达到开源SOTA水平,部分指标甚至超越了Nano Banana Pro。


在 CVTG-2K(复杂视觉文字生成)榜单中,该评测重点考察模型是否能够在同一张图像中,准确生成多处、多个区域的文字内容。结果显示,GLM-Image 在多区域文字生成准确率上表现突出,Word Accuracy 达到 0.9116,位列开源模型第一。

同时,在衡量字符级差异的 NED(归一化编辑距离)指标上,GLM-Image 以 0.9557 的成绩继续领跑,意味着其生成文字与目标文本高度一致,错字、漏字等问题显著更少。

而在更偏向“真实应用场景”的 LongText-Bench(长文本渲染)榜单中,GLM-Image 的表现也相当突出。该榜单主要考察模型在长文本、多行文字场景下的渲染能力,覆盖招牌、海报、PPT、对话框等 8 类文字密集场景,并同时设置中英文双语测试。

最终结果显示,GLM-Image 在英文任务中取得 0.952,中文任务中达到 0.979,双语成绩均位列开源模型第一。

国产芯片如何训练

而从具体如何使用国产芯片实现顶级模型训练,华为昇腾的工作人员向观察者网解释了其中的技术原理。

华为表示,其自回归结构的整个训练基座,从最早期的数据预处理,到最终的大规模预训练,全部运行在昇腾 Atlas 800T A2 设备之上。

而围绕昇腾NPU与昇思MindSpore AI框架,智谱对训练系统进行了深度定制,自研了一整套模型训练套件,对数据预处理、预训练、SFT 以及 RL 等关键环节进行了端到端优化。在执行层面,模型充分利用了动态图多级流水下发、高性能融合算子以及多流并行等特性,将原本容易成为瓶颈的流程拆解并重组。


具体来看,通过动态图的多级流水优化,Host 侧算子下发中的关键阶段被流水化并高度重叠,有效消除了算子下发带来的性能瓶颈;借助多流并行策略,通信与计算实现互相掩蔽,文本梯度同步、图像特征广播等高频操作不再“卡脖子”,显著降低了通信开销。

在算子层面,训练过程中大量采用了 AdamW EMA、COC、RMS Norm 等昇腾亲和的高性能融合算子,在提升吞吐效率的同时,也进一步增强了整体训练的稳定性。

这套软硬件深度协同的训练体系,为 GLM-Image 的规模化训练和复杂能力打下了扎实的工程基础,使其成为首个在国产芯片上完成全流程训练的SOTA多模态模型,也验证了在国产全栈算力底座上训练高性能多模态生成模型的可行性。

1毛钱生成商业级图片

而在模型架构本身,GLM-Image采用「自回归 + 扩散解码器」的混合架构。

其中9B的自回归部分负责语义理解和全局构图,全程在昇腾上训练,而7B的扩散解码器部分则采用DiT结构,配合Glyph Encoder做文字渲染,解决提笔忘字的问题。

也就是说,智谱将图像生成拆解成了理解语义和画对内容两个独立任务进行分别执行,并将其称为“认知型生成”。

这也和谷歌的Nano Banana Pro模型采用的将语言模型的推理能力和图像生成能力结合采用了类似的核心架构思路。

智谱本次模型的创新之处则在于其对Tokenizer策略,可以实现无需后期裁剪便可根据不同的需求生成1024-2048范围内长宽尺寸的图片,这也意味着无论是横屏,竖屏,社交媒体封面,电影海报还是精修照片,都可以定制成型尺寸。


观察者网就尝试生成了一张超宽的横幅,可以做到一次成型。

而在价格方面,API调用模式下,使用GLM-Image生成一张图片仅需0.1元。这一打破行业底价的成本,不仅展示了智谱的技术自信,更直接证明了国产算力在经济性上已具备与国际顶尖水平正面“硬刚”的能力。

国产替代悄然崛起

巧合的是,就在智谱发布模型的前一天1月13日,美国联邦公报正式发布新规,将英伟达H200出口审查从“推定拒绝”改为“逐案审查”,这标志着英伟达对华出口H200正式解禁。

H200的解禁,固然为中国AI企业提供了更多的算力选择,但面对这个看似对“国产替代”逻辑利空的消息,智谱GLM-Image模型的发布和股价暴涨体现了投资者们的真实态度:高端算力不再是被“卡脖子”的生存命门,而变成了“货比三家”的成本选项。

GLM-Image在国产昇腾算力上的全流程跑通,证明了即便完全脱离美系算力生态,中国头部大模型依然能够对标甚至超越像“Nano Banana Pro”这样的国际顶尖竞品。

对于资本市场而言,智谱作为上了美国实体清单的企业,本次携手华为打造出的全国产模型,也代表着以智谱为首的国产大模型企业在AI发展上有了国产算力托底和全球供应链改善的双保险。

这也意味着2026年开年的这一周,或许将成为中国AI发展史上的一个分水岭。

如果说过去两年,国产大模型还在努力证明自己“可用”,那么智谱GLM-Image与华为昇腾的这次联手,则向全行业宣告了国产全栈技术已经“好用”且“敢用”。

当国产芯片能够支撑起从万亿参数训练到极低成本推理的全生命周期,当国产模型在复杂的中文语境和视觉生成中占据鳌头,有理由相信,中国AI产业正在走出模仿与追赶,正式迈入以自主创新定义技术范式的新阶段。

来源:https://www.163.com/dy/article/KJ8HE3QD051481US.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智谱 Agentic GLM 全面登陆三星 Galaxy S25 系列手机
AI
智谱 Agentic GLM 全面登陆三星 Galaxy S25 系列手机

三星Galaxy S25系列发布:智谱Agentic GLM深度赋能,AI体验再升级 2月11日下午,科技圈的目光再次聚焦三星。随着国行版Galaxy S25系列手机的正式亮相,三款新机型——Galaxy S25、S25+以及S25 Ultra也揭开了价格面纱,起步价定在了5999元。 就在发布会后

热心网友
04.28
智谱(02513)GLM-5.1发布:逆势提价10%,开源模型超闭源,编程能力对齐Claude Opus 4.6
科技数码
智谱(02513)GLM-5.1发布:逆势提价10%,开源模型超闭源,编程能力对齐Claude Opus 4.6

智谱发布GLM-5 1:国产大模型迈进“价值定价”新阶段 就在4月8日,人工智能领域传来一则重磅消息:智谱正式发布了新一代开源模型GLM-5 1。不过,比发布本身更值得玩味的,是同步发生的一件事。根据OpenRouter平台显示的数据,智谱GLM系列模型的价格上调了10%。这一动作的影响立竿见影——

热心网友
04.22
壁仞科技完成智谱新一代旗舰模型适配
科技数码
壁仞科技完成智谱新一代旗舰模型适配

4月8日,大模型领域传来重磅更新:智谱正式上线并开源了新一代旗舰模型GLM-5 1。这一迭代版本的最大看点,在于其针对“长程任务”的处理能力取得了显著突破,无疑将拓展模型在实际应用中的边界。 硬件适配的速度,往往最能反映一个生态的活力。就在模型发布的同一天,壁仞科技便宣布,其壁砺166系列产品已完成

热心网友
04.22
智谱科技斥资约3.6亿元买楼
科技数码
智谱科技斥资约3.6亿元买楼

智谱华章拟斥资不超过3 6亿元收购北京钻石大厦物业 近日,资本市场传来一则引人关注的资产收购消息。北京智谱华章科技股份有限公司(股份代号:2513)在港交所发布公告,披露了一项重大资产收购计划。根据公告,智谱华章已于2026年4月14日与卖方安狮红钻投资有限公司及目标公司北京红钻科技发展有限公司签署

热心网友
04.22
智谱2025年报:高增长、高投入、高亏损并存
科技数码
智谱2025年报:高增长、高投入、高亏损并存

智谱2025年报:高增长、高投入与战略亏损的“三重奏” 4月20日,中国大模型领域的头部玩家——北京智谱华章科技股份有限公司(股份代号:02513)发布了2025年度报告。这份成绩单清晰地勾勒出一个特征:高增长、高投入与高亏损并存,这正是当前AI巨头在技术军备竞赛中的典型写照。 先看增长引擎。202

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026年USDT交易软件排行榜:安全可靠的平台推荐与选择指南
web3.0
2026年USDT交易软件排行榜:安全可靠的平台推荐与选择指南

本文介绍了2026年主流的USDT交易软件,重点分析了币安、欧易和火币三大平台的特点与优势。内容涵盖平台安全性、交易功能、用户体验及费用结构,旨在为不同需求的用户提供选择参考。文中强调选择平台时应综合考虑资产安全、操作便捷性和交易成本,并提醒注意风险管理与合规操作。

热心网友
05.14
2026年USDT交易软件推荐:十大安全靠谱平台深度评测
web3.0
2026年USDT交易软件推荐:十大安全靠谱平台深度评测

本文介绍了USDT交易的基本概念与主流平台选择。USDT作为稳定币,其交易主要通过加密货币交易所进行。选择平台时需综合考虑安全性、流动性、手续费和用户体验。文中列举了当前市场认可度较高的几类交易平台,并提醒用户注意资产安全与合规操作,建议根据自身需求谨慎选择。

热心网友
05.14
哥本哈根大学新研究探索AI推荐系统如何消除偏见实现公平
AI
哥本哈根大学新研究探索AI推荐系统如何消除偏见实现公平

哥本哈根大学计算机科学系于2026年3月发布了一项具有里程碑意义的研究(论文编号arXiv:2603 12935v1),揭示了当前主流AI推荐系统可能潜藏的社会偏见风险。这项研究同时指出,一种高效且低成本的解决方案——提示工程,或许能成为破解这一难题的关键。 当您使用求职平台或新闻资讯应用时,背后的

热心网友
05.14
港科大团队创新图像修复技术:仅需千张训练图,视频生成模型效果媲美百万数据
AI
港科大团队创新图像修复技术:仅需千张训练图,视频生成模型效果媲美百万数据

照片模糊了、雨滴遮挡了画面、夜晚拍摄噪点过多……这些常见的图像质量问题,往往让人束手无策。传统的解决方案,就像请来一群专科医生:去模糊、去噪点、去雨滴,各有各的专长,但每个“医生”都需要海量的“临床经验”——动辄数百万张训练图片,才能达到可用的修复水平。 然而,一项由香港科技大学、哈尔滨工业大学深圳

热心网友
05.14
UBC与Vector研究院攻克AI资源管理难题 机器人低成本高效运行指南
AI
UBC与Vector研究院攻克AI资源管理难题 机器人低成本高效运行指南

这项由英属哥伦比亚大学(UBC)与Vector人工智能研究院联合主导的前沿研究,于2026年3月以预印本论文(arXiv:2603 12634v1)形式发布。研究团队创新性地提出了“预算感知价值树搜索”(Budget-Aware Value Tree Search,简称BA VT)框架,旨在攻克一个

热心网友
05.14