IBM开源Granite 4.0:混合架构大幅降低内存需求
10月4日,IBM发布全新企业级大语言模型Granite 4.0系列。采用创新的Mamba-Transformer混合架构,新一代模型能在保持高性能的同时显著降低内存占用,从而使推理部署成本得到有效控制。
此次推出的首批Granite 4.0模型包含Small、Tiny、Micro三种规模的标准版和指令版(详细规格见下表),更高参数规模的版本和推理优化变体计划于2025年底面世。
Granite 4.0系列主要型号参数:
- Granite-4.0-H-Small:32B总参数,9B激活参数
- Granite-4.0-H-Tiny:7B总参数,1B激活参数
- Granite-4.0-H-Micro:3B总参数
- Granite-4.0-Micro:基于传统Transformer架构,3B总参数

据IBM介绍,混合架构设计在长文本输入和高并发场景下可减少70%内存需求。基准测试显示,即便是最小规模的Granite 4.0模型,性能也显著超越了前代Granite 3.3 8B版本,而Granite-4.0-H-Small则以相对精简的参数规模跻身开源模型第一梯队。


IBM以Apache 2.0开源许可证发布Granite 4.0系列模型,该系列产品不仅通过了ISO 42001认证,还采用了加密签名技术确保安全性。
相关攻略
10月23日消息,IBM 美国纽约州当地时间 22 日公布了 2025 年第三季度收益结果。该企业当季度合计营收 163 亿美元(现汇率约合 1156 55 亿元人民币),同比增长 9%、按固定汇率
10 月 21 日消息,IBM 与 AI 推理 ASIC 芯片企业 Groq 在当地时间昨日宣布建立战略性市场推广和技术合作伙伴关系,就推动共同客户企业加速 AI 部署、扩大 AI 应用展开合作。
10 月 4 日消息,IBM 当地时间 2 日宣布推出 Granite 4 0 系列企业级 LLM 模型,新一代的模型采用 Mamba-Transformer 混合架构,可在不牺牲性能的前提下大幅
9 月 20 日消息,IBM 现已正式发布了小型视觉语言模型 Granite-Docling-258M,定位于端到端文件转换场景用途,相应模型采用 Apache 2 0 开源协议,目前已在 Hug
9月19日消息,据媒体报道,IBM正式发布新一代Power11处理器及服务器,在硬件架构与虚拟化软件堆栈等领域实现全面创新。新处理器确认采用三星增强型7nm EUV光刻工艺(7LPP EUV),结合
热门专题
最新APP
热门推荐
10月26日消息,Intel原本计划在18A工艺节点大力发展外部代工,但进展非常不乐观,不得不改为内部使用,转而发展14A代工。终于迎来季度盈利后,Intel还简短披露了一个好消息:“外部客户对14
2025年10月25日,全球首款类脑智算体“智者一号(BI Explorer, BIE-1)”在横琴粤澳深度合作区正式发布。该设备由广东省智能科学与技术研究院孵化的两家科技企业——珠海横琴新近纪智能
近日,一位小米SU7 Pro车主分享了自己近一年的用车经历。提车仅一年时间,车辆行驶里程已突破21万公里,期间未出现任何故障,原装前轮胎也未曾更换。这一行驶数据意味着平均每天行驶接近540公里,对整
3D打印技术正以全新的姿态回归大众视野。从曾经的概念性产品到如今的地摊新宠,这项技术已悄然融入日常生活。夜市摊位上,3D打印的龙蛋、关节龙等创意摆件成为新一代网红商品,部分摊主半月收入突破万元,展现
云计算领域每一次技术变革,都深刻影响着产业格局与价值分配。当前,全球云计算市场正经历第三次范式转移,AI技术的爆发推动行业从资源提供者向智能引擎转型,主流厂商纷纷调整战略以应对新挑战。在PC互联网时
