谷歌祭出Gemma 4，”死磕企业级市场！25.6万上下文打造本地编程神器

时间：2026-04-07 13:00

4月3日消息，谷歌周四发布全新Gemma 4系列开放权重（open-weights）模型。该系列针对AI智能体及编程场景进行了优化，并改用更为宽松的Apache 2 0许可协议，意在扩大企业级市场份

4月3日消息，谷歌周四发布全新Gemma 4系列开放权重（open-weights）模型。该系列针对AI智能体及编程场景进行了优化，并改用更为宽松的Apache 2.0许可协议，意在扩大企业级市场份额。

此举正值中国大语言模型（LLM）快速发展之际。目前，月之暗面、阿里巴巴千问等中国企业推出的多款模型，在性能指标上已具备与OpenAI及Anthropic旗下头部模型竞争的能力。

面对激烈的市场竞争，谷歌借Gemma 4向企业客户抛出了一套安全可控的本地化部署方案。其核心卖点直击企业数据安全痛点：明确承诺绝不“窃取”企业的私有敏感数据用于未来迭代模型的训练。

作为谷歌DeepMind团队的最新力作，Gemma 4迎来了全面进化。新模型引入了“高级推理”机制，大幅强化了数学运算与指令遵循（instruction-following）能力。同时，其应用边界得到极大拓展，不仅原生支持140多种语言和函数调用（native function calling），更打通了音视频多模态输入。

延续此前的分级策略，谷歌此次提供多种参数规模的模型版本，以适配从单板计算机、智能手机到笔记本电脑及企业数据中心等不同层级的硬件环境。

该系列中参数规模最大的为一款310亿参数大语言模型。谷歌方面称，经微调后，该模型可提供同系列中最优的输出质量。

这一参数体量既避免了与谷歌大型闭源模型形成内部竞争，又保持了相对轻量化的特性，使企业无需投入高昂的GPU服务器成本即可进行本地运行或微调。

算力门槛的显著降低是此次升级的一大亮点。谷歌表示该模型16位未量化版本可在单块80GB显存的H100显卡上运行。若采用4位精度并结合Llama.cpp或Ollama等框架，该模型可在24GB显存的消费级显卡（如英伟达RTX 4090或AMD RX 7900 XTX）上部署。

针对低延迟应用场景，Gemma 4系列推出了一款260亿参数的混合专家（MoE）架构模型。在推理（inference）阶段，该模型仅激活128个专家网络中的子集（约38亿激活参数）来处理和生成词元（token）。在显存充足的条件下，其生成速度显著高于同等规模的稠密模型（dense model）。

尽管这种机制不可避免地会在输出质量上做出微小妥协，但在笔记本电脑或消费级显卡等受限于显存带宽的设备上，这种“以质量换速度”的策略无疑极具现实意义。

值得一提的是，上述两款主力模型均配备了高达25.6万词元的超大上下文窗口。这一特性使其成为本地AI代码助手的绝佳底座，这也是谷歌在发布会上着墨最多的核心落地场景。

面向下沉的端侧市场，谷歌还为智能手机及树莓派（Raspberry Pi）等算力受限的边缘硬件“量身定制”了两款微型模型，分别具备20亿和40亿的“有效参数”。这里的“有效”大有玄机：两款模型的物理参数量实为51亿和80亿，但谷歌通过引入逐层嵌入技术，硬生生将其推理时的实际计算负担压缩至23亿和45亿级别。这一技术魔术让模型在低算力、依赖电池供电的移动设备上得以高效运转。

尽管参数规模较小，这两款边缘模型仍支持12.8万个词元的上下文窗口及多模态功能，在特定的E2B/E4B版本中，它们不仅能理解文本，还能直接解析视觉与音频输入。

从谷歌公布的成绩单来看，Gemma 4较上一代Gemma 3在各项核心AI基准测试中均实现了跨越式增长。

许可协议的变更是此次发布的另一核心。Gemma 4全面转向更为宽松的Apache 2.0许可协议。此前，Gemma的专属许可协议对模型的特定使用场景设有严格限制，并保留了对违规用户的访问终止权。改用Apache 2.0协议后，企业在模型部署与商业化应用方面获得了更高的自主权，降低了因协议条款变动引发的合规风险。

生态布局方面，Gemma 4已全线登陆谷歌自家的AI Studio与AI Edge Gallery平台，并同步上线Hugging Face、Kaggle及Ollama等主流开源社区。谷歌指出，该模型在发布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余种主流推理框架。（易句）

来源：https://www.163.com/tech/article/KPIV46FF00097U7T.html

谷歌编程上下文

上一篇微软发布三款自研大模型：一边安抚OpenAI，一边打出“骨折价”！ 下一篇仅5万粉年赚3千万美元！OpenAI突击“收编”这家小播客

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略，采用“1+N+X”布局，联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm，体重69kg，移动速度0 8m s，具备40个自由度，续航超2小时。预计明年一季度发布首款车载组件机器人，已在广州车展展示。

业界动态 · 2026-06-29

中国信科刷新光通信世界纪录每秒可下载1.4万部4K电影

3月25日，光通信领域迎来又一个里程碑：中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司，成功实现了2 5Pb s 24芯光纤超大容量实时光传输，再次刷新了世界纪录。这一研究成果不仅入选国际顶级光通信会议OFC（2026）并荣获“高分论文”称号，还受国际权威SCI

业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查，焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿，不意味着立即召回，但可能引发后续监管措施。

业界动态 · 2026-06-29

doc个人图书馆停服创始人称无偿转让失败

运营长达20年，累计服务8000万用户的360doc个人图书馆，最终还是迎来了谢幕时刻。2026年5月1日，这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失，而是始终未能寻得一位能够安全接管的合适人选。创始人蔡智在告别信中坦言，近两个月来，他一直在尝试将360doc无偿转

业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月，艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证，紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后，折射出一个清晰的市场趋势：移动办公、户外出行、宿舍上网等场景的需求正在快速增长，随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿