首页 游戏 软件 资讯 排行榜 专题
首页
AI
IBM开源Granite 4.0:混合架构大幅降低内存需求

IBM开源Granite 4.0:混合架构大幅降低内存需求

热心网友
75
转载
2025-10-05

10月4日,IBM发布全新企业级大语言模型Granite 4.0系列。采用创新的Mamba-Transformer混合架构,新一代模型能在保持高性能的同时显著降低内存占用,从而使推理部署成本得到有效控制。

此次推出的首批Granite 4.0模型包含Small、Tiny、Micro三种规模的标准版和指令版(详细规格见下表),更高参数规模的版本和推理优化变体计划于2025年底面世。

Granite 4.0系列主要型号参数:

  • Granite-4.0-H-Small:32B总参数,9B激活参数
  • Granite-4.0-H-Tiny:7B总参数,1B激活参数
  • Granite-4.0-H-Micro:3B总参数
  • Granite-4.0-Micro:基于传统Transformer架构,3B总参数

IBM Granite 4.0系列

据IBM介绍,混合架构设计在长文本输入和高并发场景下可减少70%内存需求。基准测试显示,即便是最小规模的Granite 4.0模型,性能也显著超越了前代Granite 3.3 8B版本,而Granite-4.0-H-Small则以相对精简的参数规模跻身开源模型第一梯队。

Granite 4.0性能对比

Granite 4.0架构图示

IBM以Apache 2.0开源许可证发布Granite 4.0系列模型,该系列产品不仅通过了ISO 42001认证,还采用了加密签名技术确保安全性。

来源:https://www.ithome.com/0/887/506.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

IBM存储新品发布:混合云全栈适配与毫秒级勒索响应方案
AI
IBM存储新品发布:混合云全栈适配与毫秒级勒索响应方案

近日,IBM在2026存储战略沟通会上正式发布了全新一代FlashSystem存储产品线。此次升级的核心目标,是将传统存储系统转型为“AI赋能的智能存储平台”。通过集成自研的第五代FCM闪存模块与名为FlashSystem ai的智能管理引擎,新系统致力于以自动化与智能化的方式处理数据保护、性能优化

热心网友
05.18
紫光集团发布3D近存架构与新一代端侧SoC芯片
科技数码
紫光集团发布3D近存架构与新一代端侧SoC芯片

昨日,新紫光集团在其年度创新峰会上,集中展示了在算力基础设施、高速互联、智能存储及先进芯片设计等多个核心领域的最新战略布局与技术突破。经历重整后轻装上阵的科技巨头,正清晰勾勒出一条以架构创新驱动差异化发展的路径。 集团董事长李滨在主题演讲中明确,新紫光已确立芯片设计制造、ICT(信息与通信技术)基础

热心网友
05.09
IBM 发布全新 AI SSD:60 秒内检测并清除勒索软件
AI
IBM 发布全新 AI SSD:60 秒内检测并清除勒索软件

IBM 发布全新 AI SSD:60 秒内检测并清除勒索软件 最近,IBM公司发布了一条引人瞩目的消息,正式推出了新一代的FlashCore Module存储硬盘以及升级版的Storage Defender软件。这两者搭配在一起,能显著增强客户侦测并抵御网络攻击或勒索软件的能力,相当于给企业的核心数

热心网友
05.02
IBM 企业级 AI开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型
AI
IBM 企业级 AI开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型

IBM企业级AI平台迎来新成员:DeepSeek-R1蒸馏模型正式上线 技术圈又有新动态了。就在近日,IBM正式宣布,其企业级AI开发平台watsonx ai迎来了两位重量级新成员——DeepSeek-R1蒸馏版的Llama 3 1 8B与Llama 3 3 70B模型。这意味着,企业开发者现在可以

热心网友
04.28
“由守转攻”背后的IBM中国战略:破局与重塑,重新赢得中国企业的选择权
业界动态
“由守转攻”背后的IBM中国战略:破局与重塑,重新赢得中国企业的选择权

从“由守转攻”的战略决断,到“AI深耕计划”的务实落地,再到“咨询+技术”的双轮驱动,IBM 2026年的规划清晰地描绘了一幅与中国实体经济深度融合的路线图。 当“动荡”、“AI”、“焦虑”成为当下环境的三个关键词时,这家拥有百年历史的科技巨头,却在2026年的春天,于中国市场吹响了“全面由守转攻”

热心网友
04.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

多平台推广的优势与核心价值解析
业界动态
多平台推广的优势与核心价值解析

在流量日益分散的今天,把鸡蛋放在同一个篮子里,风险不言而喻。多平台推广,早已不是“要不要做”的选择题,而是“如何做好”的生存题。它的核心价值,可以概括为两点:实现“流量风险对冲”,以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵,企业不仅能有效缓冲单一

热心网友
05.19
DeepSeek知识库搭建教程 从零开始构建企业智能问答系统
业界动态
DeepSeek知识库搭建教程 从零开始构建企业智能问答系统

DeepSeek知识库的核心,是运用RAG(检索增强生成)技术,将DeepSeek强大的大语言模型推理能力,与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程(SOP)等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答,让AI的回答不再是通用泛化,而是具备专业依据、内容详

热心网友
05.19
三大运营商入局AI付费服务 使用门槛低至99元
AI
三大运营商入局AI付费服务 使用门槛低至99元

三大运营商推出Token套餐,将大模型调用量包装为类似流量包的产品,以降低AI使用门槛。中国电信推出个人与企业多档套餐,最低月费9 9元;上海移动推出1元购40万Tokens服务;联通则提供个人与团队版套餐。运营商凭借用户渠道和支付优势,推动算力消费向大众市场普及,可能重塑AI服务消费模式。

热心网友
05.19
本地部署量化模型解决HermesAgent响应慢问题
AI
本地部署量化模型解决HermesAgent响应慢问题

HermesAgent本地运行缓慢常因未量化的大语言模型占用资源过多。可通过AWQ量化模型、llama cpp后端加载GGUF模型、配置vLLM引擎提升并发吞吐、禁用非必要工具降低上下文开销,以及调整SQLite记忆检索阈值等方案优化。这些方法能显著降低延迟,提升响应速度。

热心网友
05.19
AI治理评估工程:破解智能体监管缺失的关键路径
AI
AI治理评估工程:破解智能体监管缺失的关键路径

随着AI智能体能力的持续增强,确保其行为始终符合预设目标与安全边界,已成为行业亟待解决的核心挑战。然而,当前主流的治理方案在防止智能体“失控”或“脱轨”方面,仍面临显著的实践瓶颈。 在之前的探讨中,我们分析了主流治理思路:部署多样化的对抗性验证器,构建一个多层次的安全审查网络。该方案的核心逻辑并非限

热心网友
05.19