首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
谷歌祭出Gemma 4,”死磕企业级市场!25.6万上下文打造本地编程神器

谷歌祭出Gemma 4,”死磕企业级市场!25.6万上下文打造本地编程神器

热心网友
58
转载
2026-04-07

4月3日消息,谷歌周四发布全新Gemma 4系列开放权重(open-weights)模型。该系列针对AI智能体及编程场景进行了优化,并改用更为宽松的Apache 2.0许可协议,意在扩大企业级市场份额。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

\

此举正值中国大语言模型(LLM)快速发展之际。目前,月之暗面、阿里巴巴千问等中国企业推出的多款模型,在性能指标上已具备与OpenAI及Anthropic旗下头部模型竞争的能力。

面对激烈的市场竞争,谷歌借Gemma 4向企业客户抛出了一套安全可控的本地化部署方案。其核心卖点直击企业数据安全痛点:明确承诺绝不“窃取”企业的私有敏感数据用于未来迭代模型的训练。

作为谷歌DeepMind团队的最新力作,Gemma 4迎来了全面进化。新模型引入了“高级推理”机制,大幅强化了数学运算与指令遵循(instruction-following)能力。同时,其应用边界得到极大拓展,不仅原生支持140多种语言和函数调用(native function calling),更打通了音视频多模态输入。

延续此前的分级策略,谷歌此次提供多种参数规模的模型版本,以适配从单板计算机、智能手机到笔记本电脑及企业数据中心等不同层级的硬件环境。

该系列中参数规模最大的为一款310亿参数大语言模型。谷歌方面称,经微调后,该模型可提供同系列中最优的输出质量。

这一参数体量既避免了与谷歌大型闭源模型形成内部竞争,又保持了相对轻量化的特性,使企业无需投入高昂的GPU服务器成本即可进行本地运行或微调。

算力门槛的显著降低是此次升级的一大亮点。谷歌表示该模型16位未量化版本可在单块80GB显存的H100显卡上运行。若采用4位精度并结合Llama.cpp或Ollama等框架,该模型可在24GB显存的消费级显卡(如英伟达RTX 4090或AMD RX 7900 XTX)上部署。

针对低延迟应用场景,Gemma 4系列推出了一款260亿参数的混合专家(MoE)架构模型。在推理(inference)阶段,该模型仅激活128个专家网络中的子集(约38亿激活参数)来处理和生成词元(token)。在显存充足的条件下,其生成速度显著高于同等规模的稠密模型(dense model)。

尽管这种机制不可避免地会在输出质量上做出微小妥协,但在笔记本电脑或消费级显卡等受限于显存带宽的设备上,这种“以质量换速度”的策略无疑极具现实意义。

值得一提的是,上述两款主力模型均配备了高达25.6万词元的超大上下文窗口。这一特性使其成为本地AI代码助手的绝佳底座,这也是谷歌在发布会上着墨最多的核心落地场景。

面向下沉的端侧市场,谷歌还为智能手机及树莓派(Raspberry Pi)等算力受限的边缘硬件“量身定制”了两款微型模型,分别具备20亿和40亿的“有效参数”。这里的“有效”大有玄机:两款模型的物理参数量实为51亿和80亿,但谷歌通过引入逐层嵌入技术,硬生生将其推理时的实际计算负担压缩至23亿和45亿级别。这一技术魔术让模型在低算力、依赖电池供电的移动设备上得以高效运转。

尽管参数规模较小,这两款边缘模型仍支持12.8万个词元的上下文窗口及多模态功能,在特定的E2B/E4B版本中,它们不仅能理解文本,还能直接解析视觉与音频输入。

从谷歌公布的成绩单来看,Gemma 4较上一代Gemma 3在各项核心AI基准测试中均实现了跨越式增长。


许可协议的变更是此次发布的另一核心。Gemma 4全面转向更为宽松的Apache 2.0许可协议。此前,Gemma的专属许可协议对模型的特定使用场景设有严格限制,并保留了对违规用户的访问终止权。改用Apache 2.0协议后,企业在模型部署与商业化应用方面获得了更高的自主权,降低了因协议条款变动引发的合规风险。

生态布局方面,Gemma 4已全线登陆谷歌自家的AI Studio与AI Edge Gallery平台,并同步上线Hugging Face、Kaggle及Ollama等主流开源社区。谷歌指出,该模型在发布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余种主流推理框架。(易句)

来源:https://www.163.com/tech/article/KPIV46FF00097U7T.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌iOS离线听写应用上线 内置自研Gemma大模型
业界动态
谷歌iOS离线听写应用上线 内置自研Gemma大模型

2026年4月,谷歌在iOS生态里悄悄放了个“大招”:一款主打离线优先的AI听写应用悄然上架美区App Store。这款产品内置了谷歌自研的轻量化大模型Gemma,最大的亮点是,即便完全断网,也能实现高精度的语音转文字。明眼人都能看出,它的矛头直指当前消费级听写工具市场的领头羊——Wispr Flo

热心网友
05.12
币安Binance官网下载与谷歌验证器绑定安全教程
web3.0
币安Binance官网下载与谷歌验证器绑定安全教程

币安是全球领先的数字资产交易平台。为确保安全,应直接访问其官方域名binance com,并确认网址无误。通过官网下载官方App,安卓或iOS设备需按指引完成安装。注册账户后,为提升安全性,务必在App的安全设置中绑定谷歌验证器。绑定后,进行关键操作时需输入动态验证码,从而为资产提供额外保护。

热心网友
05.12
谷歌广州天河CBD办公室预计第三季度正式启用
科技数码
谷歌广州天河CBD办公室预计第三季度正式启用

谷歌正式入驻广州国际金融中心,计划于第三季度启动跨境数智赋能服务创新项目。该项目旨在通过数字技术与智能方案,为本地企业跨境业务提供创新支持,助力产业数字化与贸易智能化升级。此举将为粤港澳大湾区企业接入全球前沿技术和服务提供新机遇。

热心网友
05.12
谷歌新手环无屏幕设计引争议 订阅制服务遭用户质疑
科技数码
谷歌新手环无屏幕设计引争议 订阅制服务遭用户质疑

谷歌发布无屏智能手环FitbitAir,需付费购买硬件。其核心高级功能需额外订阅月费会员,引发争议。订阅模式可能削弱硬件创新动力,并将用户健康数据的解析服务持续收费。相比之下,国内厂商多采用基础功能免费、增值服务付费的模式,对消费者更为友好。

热心网友
05.09
腾讯开源 Hy-MT 翻译模型:440MB 实现离线运行,性能超越谷歌翻译
业界动态
腾讯开源 Hy-MT 翻译模型:440MB 实现离线运行,性能超越谷歌翻译

腾讯开源“袖珍”AI翻译引擎:1 25比特极致压缩,手机离线跑出百GB模型水准 最近,腾讯在开源社区扔下了一颗“技术冲击波”——正式发布了紧凑型AI翻译模型Hy-MT1 5-1 8B-1 25bit。这个模型最吸引人的地方在于,它宣称能在保持高性能的同时,完全在智能手机上离线运行。这意味着什么?或许

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

峡谷唱片碎片全收集攻略 西土地区唱片位置详解
游戏攻略
峡谷唱片碎片全收集攻略 西土地区唱片位置详解

峡谷区域唯一唱片需集齐三个碎片合成。首个碎片位于地图西北角木箱木桶旁,外观如跳动火焰。集齐碎片可解锁新内容并提升游戏体验,探索时留意细节可能发现更多隐藏惊喜。

热心网友
05.12
西土唱片碎片收集攻略与获取方法详解
游戏攻略
西土唱片碎片收集攻略与获取方法详解

《遥遥西土》中,西土唱片需集齐三个碎片合成。首个碎片位于地图东南角的管子洞内,获取过程简单,无复杂谜题或战斗。整体流程清晰,玩家按指引收集全部碎片即可合成唱片,轻松完成收集任务。

热心网友
05.12
鸣潮联动赛博朋克边缘行者新角色副本上线
游戏攻略
鸣潮联动赛博朋克边缘行者新角色副本上线

《鸣潮》联动《赛博朋克:边缘行者》,推出五星角色露西与丽贝卡,可通过限定卡池与活动免费获取。联动包含专属剧情、夜之城风格场景及高难度BOSS战,并植入动画经典音乐。参与预热活动和完成剧情任务可获得限定奖励,全方位打造沉浸式赛博朋克体验。

热心网友
05.12
万物皆可蟹进化攻略:混沌爪牙基因与鼻噶流玩法解析
游戏攻略
万物皆可蟹进化攻略:混沌爪牙基因与鼻噶流玩法解析

鼻噶流”玩法围绕“混沌爪牙”基因展开,开局以小体型角色灵活发育,注重走位与策略而非堆叠体型与伤害。该玩法在较高难度下提供了与传统平推思路不同的趣味体验,适合追求新鲜操作感的玩家尝试。

热心网友
05.12
异环S级气态弧盘获取攻略 好狗狗走四方任务详解
游戏攻略
异环S级气态弧盘获取攻略 好狗狗走四方任务详解

《异环》S级气态弧盘“好狗狗走四方”可提升充能与全队攻击,适合早雾等辅助。完成主线任务“成交?成交!”后解锁番外副本“月光当铺”,首次击败BOSS墨菲克斯即可免费获取。战斗时建议中距离拉扯,优先清理小狼,搭配破韧与输出角色更易通关。

热心网友
05.12