谷歌Gemini 3.5 Flash模型最新更新_AI热点日报

谷歌Gemini 3.5 Flash模型最新更新

类型：热点整理2026-06-30

DeepMind团队刚放出个大新闻——他们把原生的计算机使用能力直接塞进了Gemini 3 5 Flash模型里。这意味着什么？开发者现在只需要一个模型，就能造出那种能在浏览器、手机或者电脑桌面上自己看屏幕、自己点按钮、自己操作的AI智能体。要知道，以前这项能力是作为一个独立模型单独提供的，开发者得

DeepMind团队刚放出个大新闻——他们把原生的计算机使用能力直接塞进了Gemini 3.5 Flash模型里。这意味着什么？开发者现在只需要一个模型，就能造出那种能在浏览器、手机或者电脑桌面上自己看屏幕、自己点按钮、自己操作的AI智能体。

要知道，以前这项能力是作为一个独立模型单独提供的，开发者得在不同模型之间来回切换、手动传递上下文，麻烦得很。现在原生集成之后，AI在执行跨平台的长任务时，再也不用人工传信息了，整个开发流程被大幅简化。

告别上下文丢失，直击Agent可靠性痛点

谷歌团队的核心判断是：AI智能体的瓶颈从来不在单个工具的极限，而在于多个工具切换时，上下文信息容易丢失。把搜索、地图和计算机操作统一到一个模型架构下，上下文就能连续流动，复杂任务中途挂掉的概率自然就降下来了。

这种“多工具合一”的设计，就像是直接盖一栋内部连通的综合大楼，省去了多栋独立建筑之间那些又长又容易出错的通信走廊。这种架构层面的调整，有望让袋里式任务的可靠性和响应延迟得到实质性改善。

锁定三大核心场景，筑牢多层安全防线

这项原生能力主要瞄准三个核心场景：需要连续数小时甚至数天持续操作的自动化任务、自动验证界面一致性的持续性软件测试、以及跨应用的知识性工作。这些场景有个共同点——极度依赖多任务之间的上下文连续性，正好可以替代人类去干那些重复又耗神的操作。

安全方面，谷歌用了多层防御策略：包括针对性的对抗训练、针对敏感操作的企业级安全护栏，还有间接提示注入检测。面对开放且不可控的真实计算机环境，这些机制共同给企业用户搭起了一道相对完整的防护墙。

来源：https://caip.org.cn/news/detail?id=47161

Gemini

延伸阅读

补充最近整理过的热点入口。