中昊芯英刹那TPU芯片首发适配智谱GLM-5

时间：2026-07-05 13:18

2月12日，智谱AI正式发布并开源全新一代旗舰大模型GLM-5。几乎在同一时间，国内唯一掌握TPU架构高性能AI芯片核心技术并实现量产的企业——中昊芯英，便完成了对GLM-5的Day0推理适配。这一联动，释放了怎样的行业信号？依托自研TPU芯片“刹那®”的高带宽近存架构与高效张量计算核心，GLM-5

2月12日，智谱AI正式发布并开源全新一代旗舰大模型GLM-5。几乎在同一时间，国内唯一掌握TPU架构高性能AI芯片核心技术并实现量产的企业——中昊芯英，便完成了对GLM-5的Day0推理适配。这一联动，释放了怎样的行业信号？

依托自研TPU芯片“刹那®”的高带宽近存架构与高效张量计算核心，GLM-5已在中昊芯英的计算平台上实现高吞吐、低延迟的稳定运行。此举不仅是双方生态合作的重要里程碑，更标志着专用算力芯片TPU在复杂工程化场景（如Coding与Agent）中的性能优势得到集中展现。

GLM-5：AgenticEngineering时代最强开源模型

GLM-5是智谱AI推出的最新基座模型，参数规模扩展至744B，并首次集成稀疏注意力机制。在真实编程场景中，其体验已逼近Claude Opus 4.5，成为当前开源领域最出色的Coding与Agent模型之一。在全球权威的ArtificialAnalysis榜单上，GLM-5位列全球第四、开源第一。

(GLM-5在ArtificialAnalysis榜单中全球排名第四、开源排名第一)

在多项学术基准测试中，GLM-5相较GLM-4.7均实现显著提升，尤其在推理、编码及智能体任务上，斩获全球所有开源模型的最佳成绩，进一步缩小了与前沿模型之间的差距。

(GLM-5在众多学术基准测试中的表现情况)

Day0适配之路：TPU赋能Coding与Agent规模化落地

“刹那®”TPU架构高性能AI专用算力芯片，由中昊芯英历时近5年100%自研，拥有完全自主可控的IP核、全自研指令集及计算平台。在AI大模型计算场景中，其算力性能超越海外知名GPU产品近1.5倍，能耗降低30%。同时，通过Chiplet技术与2.5D封装，在同等制程工艺下实现性能跃升，并支持1024片芯片片间互联，实现千卡集群线性扩容，足以支撑超千亿参数的大模型运算需求。

（中昊芯英TPU架构高性能AI专用算力芯片实物图）

实际上，中昊芯英对GLM全系列模型一直保持深度跟踪与持续适配优化。在之前GLM-4.5和4.7的适配过程中，研发团队基于“刹那®”TPU的近存架构与高效张量核心，完成了芯片与GLM系列模型架构的深度融合，显著提升了GLM-4.5和4.7在TPU集群上的推理吞吐量。这些技术积累，为本次GLM-5的Day0高效适配奠定了扎实的底层算子库和工程经验。

TPU架构天生为AI/ML场景而生。通过优化计算单元维度与数据传输路径，在大模型推理/训练等特定计算范式下，TPU相比传统GPU架构能够实现更高能效比与计算密度。在长期与GLM系列模型的适配过程中，“刹那®”芯片的可重构多级存储、近存运算设计以及流水线式时空映射，有效提升了GLM大模型的计算速度与精度，为模型处理复杂任务提供了高效支撑。

依托自研的GPTPU软件栈，中昊芯英“刹那®”TPU原生适配PyTorch、vLLM、DeepSpeed、Megatron-LM及SGLang等主流深度学习框架与推理引擎，帮助用户实现算法“零成本”跨平台迁移。无论是构建支持1024芯片片间互联的“泰则®”大规模计算集群，还是部署面向Coding和Agent场景的高并发、低延迟在线推理服务，中昊芯英均展现出对标主流专用算力产品的卓越能效与稳定性。可以说，它正在为AIGC时代构筑坚实、易用的国产专用算力底座。

（中昊芯英TPU芯片AI软件栈架构图）

从计算单元到集群：软硬件协同与核心技术突破

GLM-5拥有高达744B的超大规模参数，并首次集成稀疏注意力机制，对底层算力的并发性、通信带宽及指令调度提出了极高要求。中昊芯英从计算、通信、调度三层面实现技术突破，系统性构筑了从单芯片到千卡集群的软硬一体高效计算底座：

·算力协同优化：攻克稀疏计算瓶颈
针对GLM-5稠密计算与稀疏激活交错并存的MoE特性，中昊芯英采用面向稀疏计算的算力协同优化架构，在提升算力利用率的同时，确保模型在处理复杂Coding任务时的训练吞吐率与收敛效率。

·自适应片上网络：打通大模型负载通信高速路
大模型推理的延迟往往受限于片上通信。中昊芯英通过自适应片上网络通信架构，引入动态低延迟路由算法与网络状态感知机制，有效解决了大模型负载下的通信效率瓶颈。这使得“刹那®”芯片在驱动GLM-5执行长程Agent任务时，能够保持极高的链路利用率与通信稳定性。

·分布式执行环境：实现多级并行的高效调度
为了让GLM-5在服务器集群上实现线性扩容，中昊芯英构建了面向AI指令体系的分布式编译及执行环境。该技术支持节点间、设备内及指令级的多层次并行调度，通过融合静态图稳定性与动态图灵活性的混合建图策略，为GLM-5形成端到端的高效执行路径，确保模型在异构平台上的原生高效运行。

GLM-5擅长处理复杂系统工程与长程Agent任务，而中昊芯英的TPU AI芯片与计算平台为其提供了坚实的算力底座。通过“自研TPU芯片+超算集群+顶级大模型”的深度协同，双方正在共同为客户提供极具竞争力的AI软硬件解决方案。

中昊芯英“刹那®”TPU AI芯片对GLM-5的Day0适配，再次印证了TPU芯片“ForAI”专用架构在AIGC时代的先进性。未来，中昊芯英将继续坚定TPU技术路线，聚焦AI计算本质，并通过深化与智谱AI等顶尖合作伙伴的生态共建，为全球客户提供具备生产力变革能力的AI创新方案。

来源：https://www.icloudnews.net/a/113416.html

AI芯片

上一篇三星宣布HBM4内存正式量产速度最高达13Gbps容量达48GB 下一篇三星Galaxy手机AI助力用户步入智能便捷高效新时代

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-25

三星Galaxy S27系列再曝多处组件放弃自供

三星盖乐世S27系列预计明年春季正式登场，其中标准版与S27+主摄像头可能采用索尼传感器，并且会引入第三方显示驱动芯片及京东方OLED显示面板。而S27Pro取消了笔槽设计，内部配备5000毫安时电池。此外，猎户座2700芯片将搭载于S27和S27+两款机型上。

业界动态 · 2026-07-25

小米神秘旗舰入网，玄戒芯片、澎湃OS、自研AI大模型

小米新旗舰（型号2608BPX34C）已入网，配备67瓦快充，支持UWB超宽带技术及N79频段，或为首款阔折叠机型。该机有望搭载自研三纳米制程玄戒O3芯片与澎湃OS4操作系统，并备案了小米大模型、文心一言等多个人工智能大模型。

业界动态 · 2026-07-25

Google确认Pixel系列涨价存储芯片成本激增所致

谷歌确认其手机系列将全面涨价，因存储芯片等成本激增。新机与存量机型均受影响，旗舰款起售价上调一百美元，标准版取消入门容量配置，高端版可能缩减运行内存以平衡成本。此外，所有型号价格均有所调整。

业界动态 · 2026-07-25

特朗普因欧盟谷歌罚款暴怒，再次威胁加征巨额关税

特朗普再度释放强硬信号——这次将矛头对准欧盟，导火索是欧盟对谷歌开出一张高达10亿欧元的罚单。简单来说，新仇旧怨一并清算，关税大棒又一次挥向大西洋彼岸的盟友。事件经过如下：欧盟委员会于本周三发布新闻稿，正式宣布对谷歌处以10亿欧元罚款，理由是谷歌涉嫌违反欧盟的《数字市场法》。这部法律的核心目标就是

业界动态 · 2026-07-25

升仕175V踏板摩托车上市169cc动力升级售11800元

7月25日，升仕175V龙骨踏板摩托车正式上市，官方定价为11800元，与先前推出的150V和150X车型保持一致。先来了解几个关键信息：这款车早在7月20日就已开启销售，目前官方渠道均可查询到。最核心的升级在于动力系统。175V搭载了一台实际排量为168 7cc（最新宣传口径为169cc级别）的