谷歌Gemma 3开源模型部署效率超越DeepSeek-V3/R1_AI热点日报

谷歌Gemma 3开源模型部署效率超越DeepSeek-V3/R1

类型：热点整理2026-07-03

谷歌近期正式推出开源模型Gemma 3，其在部署效率方面全面领先DeepSeek-V3和R1。根据最新发布的评分排名，Gemma 3 27B版本仅需一块GPU（或TPU）即可运行，而相比之下，DeepSeek的两款模型各自需要32块H100 GPU。两者之间的效率差距极为显著。下面先快速回顾其八大核

谷歌近期正式推出开源模型Gemma 3，其在部署效率方面全面领先DeepSeek-V3和R1。根据最新发布的评分排名，Gemma 3 27B版本仅需一块GPU（或TPU）即可运行，而相比之下，DeepSeek的两款模型各自需要32块H100 GPU。两者之间的效率差距极为显著。下面先快速回顾其八大核心卖点：

基于Gemini 2.0技术打造，技术底蕴深厚
提供1B、4B、12B和27B四种规模，满足不同应用场景
被谷歌誉为“全球最佳单芯片模型”，可通过单GPU或TPU完成部署
在LMArena排行榜上，于非推理开源模型类别中表现最优，超越了Llama-405B、DeepSeek-V3和o3-mini，仅次于DeepSeek R1
支持多模态功能，4B及以上版本具备“高级文本与视觉推理能力”，可分析图像、文本及短视频内容
拥有128k token的上下文窗口，开箱即用，无需额外配置
支持超过35种语言，预训练数据覆盖140余种语言
整个训练过程未使用GPU，27B版本基于6144张TPUv5P卡完成

谷歌开源模型Gemma 3，部署效率完胜DeepSeek-V3/R1

从训练成本角度分析，技术报告指出，每种模型配置均已调优，以最大程度缩短训练步耗时。对于视觉编码器部分，谷歌预先计算了每张图片的嵌入向量，训练时直接调用这些嵌入结果，因此未额外增加语言模型的训练开销。不过，报告并未公开具体的训练费用明细。值得关注的是，Gemma 3 27B作为一款密集模型，在非推理开源模型赛道上成功夺得第一名，尽管比推理模型DeepSeek R1稍弱，但已显著领先于DeepSeek-V3 671B/37B。即便与前沿闭源大模型同场竞技，它也能跻身前十，这一成绩极具说服力。

（对 Gemma 3 27B IT 模型在 Chatbot Arena 中的评估（Chiang 等，2024）。所有模型均通过盲测对比评估，由人工评审员以并排方式进行评分。每项评分基于 Elo 评级系统。Gemma-3-27B-IT 的数据为初步结果，于 2025 年 3 月 8 日收到。）

关于训练数据，Gemma 3 27B训练了14万亿tokens，12B版本为12万亿，4B版本为4万亿，1B版本为2万亿。训练token数量的增加，主要为了适应图像与文本混合数据在预训练中的应用。同时，多语言数据的占比也得到提升，以扩大语言覆盖范围。谷歌引入了单语数据和平行数据，并借鉴了Chung等（2023）提出的策略，以解决不同语言数据分布不均的问题。谷歌从一开始便确立了清晰的开源思路：在发布自有前沿模型Gemini的同时，同步推出开源小模型Gemma，专门用于安卓操作系统的端侧部署。此次Gemma 3的发布延续了这一策略，目前它已成为最适合端侧部署的开源模型。总体而言，谷歌闭源大模型的API使用成本及部署效率，目前均略优于DeepSeek-V3/R1。接下来，就看DeepSeek-R2如何迎战了。

来源：https://www.53ai.com/news/OpenSourceLLM/2025031302847.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。

谷歌Gemma 3开源模型部署效率超越DeepSeek-V3/R1

相关热点

延伸阅读