游乐游手机版
首页/AI热点日报/热点详情

谷歌Gemini 3.5 Flash模型最新更新

类型:热点整理2026-06-30
DeepMind团队刚放出个大新闻——他们把原生的计算机使用能力直接塞进了Gemini 3 5 Flash模型里。这意味着什么?开发者现在只需要一个模型,就能造出那种能在浏览器、手机或者电脑桌面上自己看屏幕、自己点按钮、自己操作的AI智能体。要知道,以前这项能力是作为一个独立模型单独提供的,开发者得

DeepMind团队刚放出个大新闻——他们把原生的计算机使用能力直接塞进了Gemini 3.5 Flash模型里。这意味着什么?开发者现在只需要一个模型,就能造出那种能在浏览器、手机或者电脑桌面上自己看屏幕、自己点按钮、自己操作的AI智能体。

要知道,以前这项能力是作为一个独立模型单独提供的,开发者得在不同模型之间来回切换、手动传递上下文,麻烦得很。现在原生集成之后,AI在执行跨平台的长任务时,再也不用人工传信息了,整个开发流程被大幅简化。

告别上下文丢失,直击Agent可靠性痛点

谷歌团队的核心判断是:AI智能体的瓶颈从来不在单个工具的极限,而在于多个工具切换时,上下文信息容易丢失。把搜索、地图和计算机操作统一到一个模型架构下,上下文就能连续流动,复杂任务中途挂掉的概率自然就降下来了。

这种“多工具合一”的设计,就像是直接盖一栋内部连通的综合大楼,省去了多栋独立建筑之间那些又长又容易出错的通信走廊。这种架构层面的调整,有望让袋里式任务的可靠性和响应延迟得到实质性改善。

锁定三大核心场景,筑牢多层安全防线

这项原生能力主要瞄准三个核心场景:需要连续数小时甚至数天持续操作的自动化任务、自动验证界面一致性的持续性软件测试、以及跨应用的知识性工作。这些场景有个共同点——极度依赖多任务之间的上下文连续性,正好可以替代人类去干那些重复又耗神的操作。

安全方面,谷歌用了多层防御策略:包括针对性的对抗训练、针对敏感操作的企业级安全护栏,还有间接提示注入检测。面对开放且不可控的真实计算机环境,这些机制共同给企业用户搭起了一道相对完整的防护墙。

来源:https://caip.org.cn/news/detail?id=47161

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。