游乐游手机版
首页/AI热点日报/热点详情

谷歌免费AI Studio比付费Gemini更好用,支持录屏与作图精修

类型:热点整理2026-07-04
谷歌AI Studio——免费、强大、功能全面、更新迅速,而且上手极其简单。今天这篇内容,就围绕它展开:包括Google AI Studio与Deepmind的关系、深度体验Deepmind模型(参数调整、模型对比)、实时录制屏幕功能以及免费API额度查询等。开始前先卖个关子:朋友们知道 ai co

谷歌AI Studio——免费、强大、功能全面、更新迅速,而且上手极其简单。今天这篇内容,就围绕它展开:包括Google AI Studio与Deepmind的关系、深度体验Deepmind模型(参数调整、模型对比)、实时录制屏幕功能以及免费API额度查询等。

开始前先卖个关子:朋友们知道 ai.com 这个AI时代看起来最贵的域名是谁的吗?其实至今仍是一个谜,它很神秘,但会在不同时间指向最火的AI产品,而现在它指向了DeepSeek → 神秘的AI.com,真的被DeepSeek买下来了?话说回来,作为开发界看起来最贵的域名:ai.dev,朋友们知道现在它是谁家的吗?答案很明显:是财大气粗的Google,它指向了Google AI Studio!

Google AI Studio好在哪?在LLM用户体验方面,Google有些偏科,它在开发者体验方面投入很多,而在用户体验方面发力较晚。

最早让人注意到Google Deepmind开发者体验的,是前OpenAI开发者关系负责人Logan的加盟,后来全球最大开源模型社区HuggingFace的两位研究员也相继加入,Deepmind开发者关系团队星光熠熠,几乎没有其他AI团队可以相比。值得一提的是,Logan和一位著名独立开发者在X(Twitter)上就Google AI Studio的上手开发体验问题展开过一场客观的讨论。大型公司的产品往往有一个共同问题:上手很难——集团性授权、认证、页面跳转等,对新手很不友好。在Logan的推动下,Google AI Studio将新手上手门槛做了大幅优化:进入网站后直接用Google登录,即可在单个页面内完成API Key申请、Playground体验、复制Python代码到Colab运行等完整流程。而在近期Google Gemini一系列全新能力的发布中,Google AI Studio也都是首发位置,且都可以免费体验,没有付费门槛。咱们一起看看它都能做什么?

1. Deepmind全部模型,一个不落
在Google AI Studio里,你可以体验到最全的Deepmind模型——Gemini、Gemma以及其他最新体验类模型,一个都不少。每个模型都配有模型卡片,清晰标注了上下文长度、输入输出token单价、用途推荐、典型应用案例、知识截止日期、速率限制和延迟等信息。调用时还能指定温度、Top P等参数,并开启标准化输出、函数调用、代码执行、Google搜索等可选能力。更实用的是模型结果对比功能:同时运行两个模型,调整参数,输出结果一目了然,帮助你找到最适合应用场景的配置。

2. 免费API调用额度
免费版API的调用额度,可以通过官方文档查询:https://ai.google.dev/gemini-api/docs/rate-limits,也可以在Google AI Studio个人账户页面直接查看:https://aistudio.google.com/plan_information

3. 实时音视频交互
Gemini Live推出时确实惊艳——实时录制屏幕、语音对话,AI能即时给出语音回应,指导你完成网站操作甚至现实世界的动作。这套方案后来成了许多实时音视频助手的范本:通过特定帧率传输画面和音频,持续理解用户意图和环境,做出有记忆的判断和输出。

4. 官方示例应用(Starter Apps)
官方提供了三个Starter Apps示例应用,帮助开发者快速上手最新能力:空间理解应用(展示2D/3D空间实时理解与推理)、视频分析(通过Function Call进行内容分析)、地图探索(结合Gemini与Google Maps API)。仓库地址:https://github.com/google-gemini/starter-applets

5. 开源教程与代码示例
首先是Google Gen AI SDK,使用起来非常简洁:

from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
    model="gemini-2.0-flash", contents="Explain how AI works in a few words"
)
print(response.text)

Gemini API Cookbook同样值得关注:https://github.com/google-gemini/cookbook。几乎所有Google AI Studio的能力都能在这里找到对应的代码实现,而且更新很快。最贴心的是“Open in Colab”功能——点击即可在Colab中打开并直接运行,免去了手动创建笔记本再粘贴代码的步骤,大大缩短验证周期。

6. Prompt示例库
Prompt Gallery汇集了各种实用场景下的提示词示范。不管是找提示词灵感,还是想通过不同提示词来测试模型推理效果,这里都值得一逛。

7. 图像生成与精修
选择对应的模型,即可体验图像生成与编辑能力。通过自然语言生成图像(和其他图像模型一样),再通过自然语言进行局部微调、精修。比如,生成一张钢铁侠的图片后,让Gemini把战甲颜色改为橘色,可以看到生成结果很好地遵循了这一要求。没想到这个开发者平台,做的效果比图像生成类产品更直接。

Gemini有什么独特优势?
Gemini在面向C端用户时,有两个非常突出的亮点:Deep Research和Canvas。

1. Deep Research
Gemini Deep Research的强大,依托于Google强大的搜索数据,这一点相信任何产品都无法相比。它会先拟定一个研究计划,在获得用户许可后开始执行。研究过程中,搜索到的参考网站非常全面,一般会超过100个,且不会因为用户输入中文,就把CSDN等低质量网站纳入研究范围。在搜索数据源和质量判断上,Google的能力确实值得信赖。几分钟的搜索和Gemini解读整理后,会输出一篇非常完整的研究报告——无论格式、内容详实程度,还是信息可溯源角度,质量都非常高。免费用户每月都有指定使用次数,感兴趣的朋友可以试试,与Grok-3、OpenAI等Deep Research/Search做个对比。

2. Canvas
Canvas本身不算新鲜——OpenAI Canvas和Claude Artifacts都提供类似功能。但Gemini Canvas可以生成并实时预览代码页面、文档、SVG等内容,并且全程支持自然语言交互式编辑。


来源:https://www.53ai.com/news/LargeLanguageModel/2025032464310.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。