首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
智谱GLM-5.1高速版API发布 每秒处理400个tokens刷新全球纪录

智谱GLM-5.1高速版API发布 每秒处理400个tokens刷新全球纪录

热心网友
29
转载
2026-05-27

大模型API的响应速度纪录,再次被智谱AI刷新。2025年5月22日,智谱正式向企业客户开放GLM-5.1高速版API(GLM-5.1-highspeed),其模型输出速度突破至每秒400个token。这一成绩不仅创下了全球大模型API速度的新高,更标志着国产大模型首次在顶级模型能力与超低延迟性能上实现了双重飞跃。

智谱(02513)推出GLM-5.1高速版API 400 tokens/s刷新全球速度上限

长期以来,AI行业存在一个普遍的认知:追求更快的响应速度,往往需要以模型能力的降级为代价,即“速度越快,模型越小”。然而,GLM-5.1高速版的问世,彻底颠覆了这一传统观念。企业用户现在无需在“响应快”和“质量高”之间做选择题,可以同时获得两者带来的优势。

这一优势在代码编程、实时对话等对延迟极度敏感的应用场景中,表现得尤为突出。以AI编程助手为例,一个完整的开发任务通常涉及数十轮模型调用。如果每轮调用都需等待数秒,开发者的工作流将频繁中断,效率大打折扣。高速版API带来的“瞬时响应”体验,完美解决了多轮交互累积延迟过高的问题,使得大模型能够像一位实时在线的协作伙伴,而非反应迟缓的离线工具。

实际测试数据充分印证了其性能提升。在代码生成任务中,整体效率提升约10倍。模型不仅能极速生成代码片段,更能精准理解整个项目的上下文,提供更符合实际需求的解决方案。更令人惊叹的是,在3D场景建模等复杂任务中,文字指令能与三维场景实时同步变化;它甚至能根据用户描述,即时生成相应的工具界面,初步展现出下一代智能操作系统的雏形。

实现如此卓越性能的背后,是智谱在技术栈各层面的深度优化。该API由GLM模型团队与TileRT引擎团队协同开发,从推理引擎、调度系统到底层基础设施,完成了三层系统性升级:首先,重写核心推理路径,大幅提升单卡计算吞吐量;其次,采用动态批处理与先进的KV缓存调度策略,有效降低尾部延迟;最后,对计算集群与网络架构进行协同优化,从而保障每秒400个token的稳定、高速输出。

其中的关键技术突破,在于智谱自研的TileRT推理引擎。该引擎通过编译期的静态计算图编排与Tile级微任务调度技术,最大限度地消除了计算过程中的内存与调度开销,使计算效率无限逼近硬件理论极限。

目前,GLM-5.1高速版已针对AI编程、实时交互应用、高频商业决策、实时语音对话等高时效性场景完成专项优化,并通过智谱MaaS平台面向企业定向开放。随着推理引擎技术的持续迭代与高速服务范围的不断扩大,智谱正致力于为企业客户提供兼具超低延迟与顶尖智能的工业化AI能力,进一步强化国产大模型在全球技术竞争中的领先优势。

来源:https://www.163.com/dy/article/KTHAMEVM05198UNI.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智谱GLM-5.1高速版API发布 每秒处理400个tokens刷新全球纪录
科技数码
智谱GLM-5.1高速版API发布 每秒处理400个tokens刷新全球纪录

智谱推出GLM-5 1高速版API,输出速度达每秒400个token,刷新全球大模型API速度上限。该版本实现旗舰能力与低延迟的双重突破,打破“快即小”的行业认知。在代码编程等实时交互场景中效率显著提升,支持多轮快速调用。其性能得益于自研TileRT推理引擎及三层深度优化,现已面向企业客户在高敏感场景中定向开放。

热心网友
05.27
智谱AI AutoClaw本地一键部署指南 预置50多种热门技能
AI资讯
智谱AI AutoClaw本地一键部署指南 预置50多种热门技能

今天,国内AI领域有个值得关注的新动态:智谱AI旗下的AutoClaw(中文名“澳龙”)正式上线了。简单来说,这是一个能让普通用户在本地电脑上,真正实现“一键部署”个人AI助手“龙虾”(OpenClaw)的工具。 这意味着什么?过去,想在本地设备上搭建一个功能完整的AI助手,往往需要一定的技术门槛和

热心网友
05.20
Cortex获6000万美元融资消除开发者税 智谱完成数十亿元国资融资 Claude企业版上线
AI资讯
Cortex获6000万美元融资消除开发者税 智谱完成数十亿元国资融资 Claude企业版上线

Cortex融资6000万美元优化工程运营,智谱AI获数十亿元国资领投。ArsenalBio融资3 25亿美元开发癌症疗法,You com筹集5000万美元发展AI搜索。Claude推出企业版定制助手,腾讯发布混元Turbo大模型。支付宝上线AI生活管家,零一万物开源编程助手模型。多领域AI初创公司获得融资,产品聚焦医疗、安全与开发效率。

热心网友
05.16
智谱AI获华策亿元投资共建影视AI平台 杨红霞入职港理工 蔚来首发智能驾驶世界模型
AI资讯
智谱AI获华策亿元投资共建影视AI平台 杨红霞入职港理工 蔚来首发智能驾驶世界模型

智谱获华策1亿元战略投资,将共建影视AI研究平台。蔚来发布国内首个智能驾驶世界模型NWM。杨红霞入职香港理工大学,其端侧模型创业项目同步推进。此外,多家AI公司在安全、医疗、药物研发等领域获得融资,涵盖Chainguard、溪砾科技等。OpenAI的SearchGPT演示出错,引发对其搜索能力的讨论。

热心网友
05.16
智谱 Agentic GLM 全面登陆三星 Galaxy S25 系列手机
AI资讯
智谱 Agentic GLM 全面登陆三星 Galaxy S25 系列手机

三星Galaxy S25系列发布:智谱Agentic GLM深度赋能,AI体验再升级 2月11日下午,科技圈的目光再次聚焦三星。随着国行版Galaxy S25系列手机的正式亮相,三款新机型——Galaxy S25、S25+以及S25 Ultra也揭开了价格面纱,起步价定在了5999元。 就在发布会后

热心网友
04.28

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

NeuroStream视觉数据底座实测报告发布性能与应用解析
科技数码
NeuroStream视觉数据底座实测报告发布性能与应用解析

随着人工智能大模型与机器视觉技术的深度融合与产业升级,一个根本性的挑战愈发关键:底层视觉数据基础设施的能效水平,直接决定了上层AI应用的成本边界与识别精度的上限。近期,Robo ai (NASDAQ: AIIO) 旗下专注于AI基础设施的Neurovia AI,在第九届国际安全与国家风险防范展(IS

热心网友
05.27
安全出币技巧指南:掌握高效交易与资金保障的关键
web3.0
安全出币技巧指南:掌握高效交易与资金保障的关键

数字货币成功变现需掌握关键技巧:理解市场动态与主流币种联动,选择安全高流动性平台,制定明确风险目标和交易策略,严格执行止损与分散投资。市场持续变化,保持学习与适应能力是长期稳健交易的基础。

热心网友
05.27
华硕电竞显示器618选购指南 高性价比双子星推荐
科技数码
华硕电竞显示器618选购指南 高性价比双子星推荐

618购物节是电竞玩家升级装备的良机。华硕TUFGaming系列的战杀27与小金刚显示器凭借FastIPS面板、高刷新率、精准色彩及丰富电竞功能,以高性价比满足不同玩家对帧率与画质的追求,成为热门选择。

热心网友
05.27
2026年二战飞行游戏推荐:空战模拟与对战佳作盘点
游戏资讯
2026年二战飞行游戏推荐:空战模拟与对战佳作盘点

移动端二战空战游戏以机械浪漫与硬核操作吸引玩家。多款作品各具特色:或精细还原战机与基地经营,或重现太平洋战场任务,或融合弹幕射击与昼夜战术,或侧重战机收集养成,或提供割草式爽快体验。它们以历史氛围带玩家重返决定历史的天空。

热心网友
05.27
和平精英安V收车币如何革新游戏经济与玩家交易生态
web3.0
和平精英安V收车币如何革新游戏经济与玩家交易生态

《和平精英》中,“安V收车币”作为一种新兴交易方式,为玩家获取稀有车辆皮肤提供了安全便捷的渠道。它满足了玩家个性化需求,提升了游戏体验与沉浸感。参与交易需选择正规平台,合理规划消费并遵守官方规定,以保障自身权益。这一模式活跃了游戏经济,丰富了玩家的资源选择。

热心网友
05.27