游乐游手机版
首页/AI热点日报/热点详情

谷歌Gemma 3开源模型部署效率超越DeepSeek-V3/R1

类型:热点整理2026-07-03
谷歌近期正式推出开源模型Gemma 3,其在部署效率方面全面领先DeepSeek-V3和R1。根据最新发布的评分排名,Gemma 3 27B版本仅需一块GPU(或TPU)即可运行,而相比之下,DeepSeek的两款模型各自需要32块H100 GPU。两者之间的效率差距极为显著。下面先快速回顾其八大核

谷歌近期正式推出开源模型Gemma 3,其在部署效率方面全面领先DeepSeek-V3和R1。根据最新发布的评分排名,Gemma 3 27B版本仅需一块GPU(或TPU)即可运行,而相比之下,DeepSeek的两款模型各自需要32块H100 GPU。两者之间的效率差距极为显著。下面先快速回顾其八大核心卖点:

  1. 基于Gemini 2.0技术打造,技术底蕴深厚
  2. 提供1B、4B、12B和27B四种规模,满足不同应用场景
  3. 被谷歌誉为“全球最佳单芯片模型”,可通过单GPU或TPU完成部署
  4. 在LMArena排行榜上,于非推理开源模型类别中表现最优,超越了Llama-405B、DeepSeek-V3和o3-mini,仅次于DeepSeek R1
  5. 支持多模态功能,4B及以上版本具备“高级文本与视觉推理能力”,可分析图像、文本及短视频内容
  6. 拥有128k token的上下文窗口,开箱即用,无需额外配置
  7. 支持超过35种语言,预训练数据覆盖140余种语言
  8. 整个训练过程未使用GPU,27B版本基于6144张TPUv5P卡完成

谷歌开源模型Gemma 3,部署效率完胜DeepSeek-V3/R1

从训练成本角度分析,技术报告指出,每种模型配置均已调优,以最大程度缩短训练步耗时。对于视觉编码器部分,谷歌预先计算了每张图片的嵌入向量,训练时直接调用这些嵌入结果,因此未额外增加语言模型的训练开销。不过,报告并未公开具体的训练费用明细。值得关注的是,Gemma 3 27B作为一款密集模型,在非推理开源模型赛道上成功夺得第一名,尽管比推理模型DeepSeek R1稍弱,但已显著领先于DeepSeek-V3 671B/37B。即便与前沿闭源大模型同场竞技,它也能跻身前十,这一成绩极具说服力。

(对 Gemma 3 27B IT 模型在 Chatbot Arena 中的评估(Chiang 等,2024)。所有模型均通过盲测对比评估,由人工评审员以并排方式进行评分。每项评分基于 Elo 评级系统。Gemma-3-27B-IT 的数据为初步结果,于 2025 年 3 月 8 日 收到。)

关于训练数据,Gemma 3 27B训练了14万亿tokens,12B版本为12万亿,4B版本为4万亿,1B版本为2万亿。训练token数量的增加,主要为了适应图像与文本混合数据在预训练中的应用。同时,多语言数据的占比也得到提升,以扩大语言覆盖范围。谷歌引入了单语数据和平行数据,并借鉴了Chung等(2023)提出的策略,以解决不同语言数据分布不均的问题。谷歌从一开始便确立了清晰的开源思路:在发布自有前沿模型Gemini的同时,同步推出开源小模型Gemma,专门用于安卓操作系统的端侧部署。此次Gemma 3的发布延续了这一策略,目前它已成为最适合端侧部署的开源模型。总体而言,谷歌闭源大模型的API使用成本及部署效率,目前均略优于DeepSeek-V3/R1。接下来,就看DeepSeek-R2如何迎战了。

来源:https://www.53ai.com/news/OpenSourceLLM/2025031302847.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。