游乐游手机版
首页/AI热点日报/热点详情

谷歌Gemini 2.0 Pro多模态编程能力免费开放

类型:热点整理2026-06-29
谷歌发布Gemini2 0系列,全部免费开放。2 0Pro实验性模型支持200万token上下文,在代码生成和推理上表现突出,获首席科学家JeffDean好评。2 0Flash正式上线,低延迟高性能;2 0Flash-Lite兼具成本效益。所有模型支持多模态输入,免费额度每日最高1500次。

谷歌DeepMind刚刚投下了一枚重磅冲击波——Gemini 2.0系列现已全面开放,而且全部免费。这波更新带来的信息量不小,新模型、新能力,还有那个让Jeff Dean都直呼“震惊”的编程表现。来,我们直接把核心内容拆开看看。

先说说最受关注的Gemini 2.0 Pro。这是个实验性模型,但在代码生成和复杂推理方面表现相当抢眼,支持高达200万个token的上下文窗口——这意味着它能一口气处理海量信息。谷歌首席科学家Jeff Dean亲自下场带货,用一个Boggle填字游戏的例子演示了它的编码能力:只需要一个相对简单的提示,模型就能写出完整的代码,包括所有正确的数据结构和搜索算法,一次性在游戏板上找到所有有效单词。Dean用了"Discombobulating"(令人困惑/震惊)来形容这个表现,作为计算机科学家,他对模型第一次就能把数据结构写对这件事尤其满意。

看得出来,Gemini 2.0 Pro在代码生成这条赛道上,底子相当扎实。

主要亮点:

Gemini 2.0 Flash 正式上线:去年12月还是实验版本的2.0 Flash,现在正式转正了。低延迟、高性能,开发者可以直接通过Google AI Studio和Vertex AI中的Gemini API,把它用到生产级应用里。

Gemini 2.0 Pro Experimental 发布:专为代码性能和复杂提示优化,推理能力强,200万token的上下文窗口摆在那里,处理复杂问题游刃有余。Gemini Advanced用户现在就能在Gemini应用里体验。

Gemini 2.0 Flash-Lite 亮相:2.0系列里最具成本效益的选手。在保持跟1.5 Flash相同速度和成本的前提下,质量明显提升,大部分基准测试已经超越1.5 Flash。同样支持100万token上下文窗口和多模态输入。

2.0 Flash Thinking Experimental 面向Gemini应用用户开放:此前只出现在Google AI Studio里的Thinking模型,现在桌面端和移动端的Gemini用户也能在模型下拉菜单里直接调用了。

多模态能力:所有模型发布时都支持多模态输入(文本输出),未来几个月内会逐步支持更多模态。

模型性能对比:

谷歌给出了一个详细的性能对照表,把Gemini 1.5 Flash、1.5 Pro、2.0 Flash-Lite、2.0 Flash和2.0 Pro Experimental放在一起比了比。几个关键指标值得关注:

能力基准测试1.5 Flash1.5 Pro2.0 Flash-Lite2.0 Flash2.0 Pro Exp
通用MMLU-Pro67.3%75.8%71.6%77.6%79.1%
代码LiveCodeBench (v5)30.7%34.2%28.9%34.5%36.0%
Bird-SQL (Dev)45.6%54.4%57.4%58.7%59.3%
推理GPQA (diamond)51.0%59.1%51.5%60.1%64.7%
事实性SimpleQA8.6%24.9%21.7%29.9%44.3%
FACTS Grounding82.9%80.0%83.6%84.6%82.8%
多语言Global MMLU (Lite)73.7%80.8%78.2%83.4%86.5%
数学MATH77.9%86.5%86.8%90.9%91.8%
HiddenMath47.2%52.0%55.3%63.5%65.2%
长上下文MRCR (1M)71.9%82.6%58.0%70.5%74.7%
图像MMMU62.3%65.9%68.0%71.7%72.7%
音频CoVoST2(21 lang)37.440.138.439.040.6
视频EgoSchema (test)66.8%71.2%67.2%71.1%71.9%

从数据来看,2.0 Pro Experimental在大部分基准测试上确实拔得头筹,尤其是推理、事实性和数学能力上优势明显。但2.0 Flash也不弱,在很多项目上已经超过了1.5 Pro,性价比非常突出。

一点个人的判断

这次发布的重点是Gemini 2.0 Pro,但从现有信息来看,它并没有带来那种“碘伏性”的惊喜。跟OpenAI o3 mini high、Claude 3.5 Sonnet、DeepSeek R1这些选手比起来,编程能力到底谁更强,还得等后续实测数据说话。

不过谷歌有一点确实很良心——模型全部免费开放使用。Gemini 2.0 Pro每天有50次提问额度,其他模型更是给到了1500次免费额度。这个力度,在当前的AI模型定价环境下,确实算是诚意满满了。

来源:https://www.53ai.com/news/MultimodalLargeModel/2025020646389.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。