游乐游手机版
首页/业界动态/文章详情

谷歌祭出Gemma 4,”死磕企业级市场!25.6万上下文打造本地编程神器

时间:2026-04-07 13:00
4月3日消息,谷歌周四发布全新Gemma 4系列开放权重(open-weights)模型。该系列针对AI智能体及编程场景进行了优化,并改用更为宽松的Apache 2 0许可协议,意在扩大企业级市场份

4月3日消息,谷歌周四发布全新Gemma 4系列开放权重(open-weights)模型。该系列针对AI智能体及编程场景进行了优化,并改用更为宽松的Apache 2.0许可协议,意在扩大企业级市场份额。

\

此举正值中国大语言模型(LLM)快速发展之际。目前,月之暗面、阿里巴巴千问等中国企业推出的多款模型,在性能指标上已具备与OpenAI及Anthropic旗下头部模型竞争的能力。

面对激烈的市场竞争,谷歌借Gemma 4向企业客户抛出了一套安全可控的本地化部署方案。其核心卖点直击企业数据安全痛点:明确承诺绝不“窃取”企业的私有敏感数据用于未来迭代模型的训练。

作为谷歌DeepMind团队的最新力作,Gemma 4迎来了全面进化。新模型引入了“高级推理”机制,大幅强化了数学运算与指令遵循(instruction-following)能力。同时,其应用边界得到极大拓展,不仅原生支持140多种语言和函数调用(native function calling),更打通了音视频多模态输入。

延续此前的分级策略,谷歌此次提供多种参数规模的模型版本,以适配从单板计算机、智能手机到笔记本电脑及企业数据中心等不同层级的硬件环境。

该系列中参数规模最大的为一款310亿参数大语言模型。谷歌方面称,经微调后,该模型可提供同系列中最优的输出质量。

这一参数体量既避免了与谷歌大型闭源模型形成内部竞争,又保持了相对轻量化的特性,使企业无需投入高昂的GPU服务器成本即可进行本地运行或微调。

算力门槛的显著降低是此次升级的一大亮点。谷歌表示该模型16位未量化版本可在单块80GB显存的H100显卡上运行。若采用4位精度并结合Llama.cpp或Ollama等框架,该模型可在24GB显存的消费级显卡(如英伟达RTX 4090或AMD RX 7900 XTX)上部署。

针对低延迟应用场景,Gemma 4系列推出了一款260亿参数的混合专家(MoE)架构模型。在推理(inference)阶段,该模型仅激活128个专家网络中的子集(约38亿激活参数)来处理和生成词元(token)。在显存充足的条件下,其生成速度显著高于同等规模的稠密模型(dense model)。

尽管这种机制不可避免地会在输出质量上做出微小妥协,但在笔记本电脑或消费级显卡等受限于显存带宽的设备上,这种“以质量换速度”的策略无疑极具现实意义。

值得一提的是,上述两款主力模型均配备了高达25.6万词元的超大上下文窗口。这一特性使其成为本地AI代码助手的绝佳底座,这也是谷歌在发布会上着墨最多的核心落地场景。

面向下沉的端侧市场,谷歌还为智能手机及树莓派(Raspberry Pi)等算力受限的边缘硬件“量身定制”了两款微型模型,分别具备20亿和40亿的“有效参数”。这里的“有效”大有玄机:两款模型的物理参数量实为51亿和80亿,但谷歌通过引入逐层嵌入技术,硬生生将其推理时的实际计算负担压缩至23亿和45亿级别。这一技术魔术让模型在低算力、依赖电池供电的移动设备上得以高效运转。

尽管参数规模较小,这两款边缘模型仍支持12.8万个词元的上下文窗口及多模态功能,在特定的E2B/E4B版本中,它们不仅能理解文本,还能直接解析视觉与音频输入。

从谷歌公布的成绩单来看,Gemma 4较上一代Gemma 3在各项核心AI基准测试中均实现了跨越式增长。


许可协议的变更是此次发布的另一核心。Gemma 4全面转向更为宽松的Apache 2.0许可协议。此前,Gemma的专属许可协议对模型的特定使用场景设有严格限制,并保留了对违规用户的访问终止权。改用Apache 2.0协议后,企业在模型部署与商业化应用方面获得了更高的自主权,降低了因协议条款变动引发的合规风险。

生态布局方面,Gemma 4已全线登陆谷歌自家的AI Studio与AI Edge Gallery平台,并同步上线Hugging Face、Kaggle及Ollama等主流开源社区。谷歌指出,该模型在发布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余种主流推理框架。(易句)

来源:https://www.163.com/tech/article/KPIV46FF00097U7T.html
上一篇微软发布三款自研大模型:一边安抚OpenAI,一边打出“骨折价”! 下一篇仅5万粉年赚3千万美元!OpenAI突击“收编”这家小播客
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿