一、重磅工具:谷歌Gemini迈向全能智能体,从“聪明”进阶到“能干”
本周谷歌发布的两项新功能共同助力Gemini CLI成为功能强大的通用AI智能体。

谷歌正式推出Gemini 2.5计算机使用模型(Gemini 2.5 Computer Use)。这款专用模型能够通过操作用户交互界面来完成任务。新模型支持开发者在浏览器与移动应用中构建具备点击、滚动、文本输入及表单填写能力的AI智能体,并通过名为computer_use的工具来控制计算机。在网页和移动设备控制基准测试中,新模型表现优于竞争对手,WebVoyager测试成绩达到79.9%,且延迟较低。Gemini 2.5计算机使用模型现已通过Gemini API调用。
谷歌开源AI编程智能体Gemini CLI现已支持扩展机制。这使得Gemini CLI能够连接各种工具,并利用“playbook”和用户自定义扩展来个性化开发者的工作流程,成为更强大更通用的AI智能体。谷歌公布了首批支持Gemini CLI扩展的合作伙伴名单,其中包括Figma、Shopify、Stripe等。
锐评:感觉自己的岗位岌岌可危。
二、AI技术与产品发布:人形机器人、脑机接口争相落地
1. 新闻:Figure AI公司发布第三代人形机器人Figure 03。该机器人拥有5小时续航、无线充电功能和增强的传感器,搭载的Helix AI系统可实现视觉、语言与行动的控制能力。Figure AI已建成年产1.2万台机器人的生产线,计划实现规模化量产。
