IBM开源Granite 4.0：混合架构大幅降低内存需求

首页

热心网友

转载

2025-10-05

10月4日，IBM发布全新企业级大语言模型Granite 4.0系列。采用创新的Mamba-Transformer混合架构，新一代模型能在保持高性能的同时显著降低内存占用，从而使推理部署成本得到有效控制。

此次推出的首批Granite 4.0模型包含Small、Tiny、Micro三种规模的标准版和指令版（详细规格见下表），更高参数规模的版本和推理优化变体计划于2025年底面世。

Granite 4.0系列主要型号参数：

Granite-4.0-H-Small：32B总参数，9B激活参数
Granite-4.0-H-Tiny：7B总参数，1B激活参数
Granite-4.0-H-Micro：3B总参数
Granite-4.0-Micro：基于传统Transformer架构，3B总参数

IBM Granite 4.0系列

据IBM介绍，混合架构设计在长文本输入和高并发场景下可减少70%内存需求。基准测试显示，即便是最小规模的Granite 4.0模型，性能也显著超越了前代Granite 3.3 8B版本，而Granite-4.0-H-Small则以相对精简的参数规模跻身开源模型第一梯队。

Granite 4.0性能对比

Granite 4.0架构图示

IBM以Apache 2.0开源许可证发布Granite 4.0系列模型，该系列产品不仅通过了ISO 42001认证，还采用了加密签名技术确保安全性。

来源:https://www.ithome.com/0/887/506.htm

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：日立携手OpenAI，共推AI数据中心电力能效优化下一篇：贝索斯称AI兼具泡沫与实际价值，太空数据中心或成真

相关攻略

IBM存储新品发布：混合云全栈适配与毫秒级勒索响应方案

近日，IBM在2026存储战略沟通会上正式发布了全新一代FlashSystem存储产品线。此次升级的核心目标，是将传统存储系统转型为“AI赋能的智能存储平台”。通过集成自研的第五代FCM闪存模块与名为FlashSystem ai的智能管理引擎，新系统致力于以自动化与智能化的方式处理数据保护、性能优化

热心网友

05.18

科技数码

紫光集团发布3D近存架构与新一代端侧SoC芯片

昨日，新紫光集团在其年度创新峰会上，集中展示了在算力基础设施、高速互联、智能存储及先进芯片设计等多个核心领域的最新战略布局与技术突破。经历重整后轻装上阵的科技巨头，正清晰勾勒出一条以架构创新驱动差异化发展的路径。集团董事长李滨在主题演讲中明确，新紫光已确立芯片设计制造、ICT（信息与通信技术）基础

热心网友

05.09

IBM 发布全新 AI SSD：60 秒内检测并清除勒索软件

IBM 发布全新 AI SSD：60 秒内检测并清除勒索软件最近，IBM公司发布了一条引人瞩目的消息，正式推出了新一代的FlashCore Module存储硬盘以及升级版的Storage Defender软件。这两者搭配在一起，能显著增强客户侦测并抵御网络攻击或勒索软件的能力，相当于给企业的核心数

热心网友

05.02

IBM 企业级 AI开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型

IBM企业级AI平台迎来新成员：DeepSeek-R1蒸馏模型正式上线技术圈又有新动态了。就在近日，IBM正式宣布，其企业级AI开发平台watsonx ai迎来了两位重量级新成员——DeepSeek-R1蒸馏版的Llama 3 1 8B与Llama 3 3 70B模型。这意味着，企业开发者现在可以

热心网友

04.28

业界动态

“由守转攻”背后的IBM中国战略：破局与重塑，重新赢得中国企业的选择权

从“由守转攻”的战略决断，到“AI深耕计划”的务实落地，再到“咨询+技术”的双轮驱动，IBM 2026年的规划清晰地描绘了一幅与中国实体经济深度融合的路线图。当“动荡”、“AI”、“焦虑”成为当下环境的三个关键词时，这家拥有百年历史的科技巨头，却在2026年的春天，于中国市场吹响了“全面由守转攻”

热心网友

04.15

热门推荐

业界动态

多平台推广的优势与核心价值解析

在流量日益分散的今天，把鸡蛋放在同一个篮子里，风险不言而喻。多平台推广，早已不是“要不要做”的选择题，而是“如何做好”的生存题。它的核心价值，可以概括为两点：实现“流量风险对冲”，以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵，企业不仅能有效缓冲单一

热心网友

05.19

业界动态

DeepSeek知识库搭建教程从零开始构建企业智能问答系统

DeepSeek知识库的核心，是运用RAG（检索增强生成）技术，将DeepSeek强大的大语言模型推理能力，与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程（SOP）等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答，让AI的回答不再是通用泛化，而是具备专业依据、内容详

热心网友

05.19