首页 游戏 软件 资讯 排行榜 专题
首页
AI
谷歌发布最强具身大脑 波士顿动力机器狗实现拟人化智能

谷歌发布最强具身大脑 波士顿动力机器狗实现拟人化智能

热心网友
11
转载
2026-05-19

谷歌DeepMind的机器人推理模型迎来重要升级。最新发布的Gemini Robotics-ER 1.6,旨在让机器人更接近一个真正“实用”的智能体——它不仅需要执行命令,更要能深度理解并适应复杂的物理环境。

搭载这套新系统的波士顿动力机器狗Spot,在工厂巡检时已能自主导航至压力表前,精准停下并读取表盘刻度数值。同时,机械臂在执行操作任务时,也能自主判断任务的启动时机,以及更关键的——如何准确判定任务已圆满完成。

这是Gemini Robotics专注于空间推理的第三代模型。其发布正值一个关键节点:九年前谷歌出售了波士顿动力,而今年初的CES展会上,双方宣布再度携手。ER 1.6可视为这次“重逢”后交付的首个重要成果。DeepMind负责人德米斯·哈萨比斯也第一时间转发了相关消息。

ER 1.6的定位十分明确:充当机器人的“高层决策中枢”。它不直接操控具体关节动作,而是负责环境感知、任务规划与工具调用。无论是接入谷歌搜索、调用视觉语言模型(VLA),还是执行开发者自定义的函数,它都能胜任。

相较于前代ER 1.5及Gemini 3.0 Flash,新模型在空间推理、物体计数与任务成功判定等核心能力上均有大幅提升。此外,它还解锁了一项关键新技能:准确解读各类仪表盘。

Gemini Robotics-ER 1.6:赋能机器人深度环境感知

正如其技术博客所强调,机器人要迈向实际应用,必须超越简单的指令响应,发展出对物理世界进行逻辑推理的能力。

ER 1.6的所有核心改进,都围绕一个核心目标:让机器人系统真正“读懂”它所处的场景。

从“图像采集”到“信息解读”:仪表识别实现跨越

首先来看Spot在工业场景中展现的新技能。工厂内遍布着需要定期监控的仪表,如温度计、压力表和液位视镜。以往的Spot或许能走近并拍摄图像,但无法理解表盘显示的具体含义。

ER 1.6改变了这一局面。其仪表识别流程分为三步:首先放大图像区域以清晰捕捉细小刻度;随后利用“指向”(Pointing)能力精确定位指针与刻度线,结合代码进行比例换算;最后调用内置知识库,将原始数值转化为有实际意义的物理读数。

这套组合方案效果卓越。ER 1.5的仪表识别成功率仅为23%,而在引入“智能体视觉”(Agentic Vision)技术后,ER 1.6将成功率大幅提升至93%。

波士顿动力公司Spot产品副总裁马可·达席尔瓦对此评价:“仪表识别等高级能力,结合更可靠的任务推理,将使Spot能够完全自主地观察、解析并应对现实世界中的各类挑战。”

“指向”能力:空间理解的核心基础

仪表识别能达到如此高的精度,其根基在于“指向”(Pointing)能力的强化。这是ER模型系列自初代以来持续打磨的基本功,本质是让模型能用“空间坐标”来表达其对场景的理解——包括物体位置、数量统计以及最佳抓取或移动路径。

ER 1.5曾在此类任务上表现不足:面对一张工具图片,它错误统计了锤子数量,遗漏了剪刀,甚至指出了图中并不存在的“手推车”。而ER 1.6则能准确回答:包含2把锤子、1把剪刀、1支画笔和6把钳子,无一错漏。更重要的是,对于图中未出现的物品,它不会进行虚构。

成功状态检测:精准判断任务终点

ER 1.6的另一项重要升级是“成功检测”能力。准确判断任务何时完成,与知晓如何启动任务同样关键,这是机器人实现高度自主的核心。

以往的系统通常在执行完预设动作序列后即视为任务结束。但在真实复杂环境中,存在遮挡、光照变化和指令模糊等多种干扰因素,“任务是否真正完成”本身就需要高级认知进行判断。ER 1.6增强了多视角协同推理能力,能够综合机器人搭载的多个摄像头(如顶部和腕部)的画面信息,做出连贯且可靠的最终判定。

例如在开头的演示中:将蓝色笔放入黑色笔筒后,任务真的完成了吗?ER 1.6能从多个观测角度进行交叉验证,给出确切的肯定答案。

值得一提的是,这也是谷歌迄今为止最安全的机器人模型。在对抗性空间推理测试中,ER 1.6对安全指令的遵循程度优于所有前代版本。对于“不处理液体”、“不搬运超过20公斤物体”这类物理安全约束,它能通过“指向”等空间输出做出更精确的合规判断。

在基于真实事故报告的安全风险识别测试中,ER系列模型的表现比Gemini 3.0 Flash高出6%(文本场景)和10%(视频场景)。

谷歌与波士顿动力:九年后的战略再携手

读到这里,您可能会好奇:为何是波士顿动力的Spot?这背后有一段战略分合的历程。

谷歌于2013年收购波士顿动力,却在2017年将其出售给软银,当时公开的原因是“未能找到清晰的商业化路径”。2020年,现代汽车以约8.8亿美元的价格完成了收购。转折发生在2025年11月,波士顿动力前首席技术官亚伦·桑德斯离职并加入了谷歌DeepMind。

随后,在2026年1月的国际消费电子展(CES)上,谷歌与波士顿动力在现代汽车的发布会上正式宣布合作,目标是将Gemini Robotics系统部署到Atlas人形机器人平台。

出售九年后,又以另一种形式“回归”。哈萨比斯对此的阐释是,谷歌自身不制造硬件机器人,而是致力于成为“机器人领域的安卓系统”,为所有机器人制造商提供核心智能。

本次ER 1.6的发布,署名作者是劳拉·格雷瑟和彭旭。劳拉·格雷瑟拥有牛津大学本科和纽约大学硕士学位,于2018年加入谷歌,自2024年起在DeepMind从事机器人研究。她还合著了强化学习领域的教科书《深度强化学习基础》。

她早期的研究方向之一,是训练机器人打乒乓球,这要求整个系统在100毫秒内完成环境感知、轨迹计算与击球执行等一系列动作。

彭旭是DeepMind机器人基础模型方向的研究员,专注于机器人学习与大语言模型的融合。他不仅是上述机器人乒乓球项目的参与者,也是RT-1、RT-2、代码即策略(Cap)以及Gemini Robotics等一系列知名研究成果的核心作者之一。

来源:https://www.51cto.com/article/840795.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

2026年Hermes Agent功能详解与应用场景全指南
AI
2026年Hermes Agent功能详解与应用场景全指南

HermesAgent是一款开源自主AI智能体框架,定位为可持久运行、自我进化的“数字员工”。它以任务完成为导向,通过四层架构处理信息、操作文件、执行终端命令及自动化浏览器,支持六种部署方式,并通过统一网关接入微信等多平台。其关键特性在于能从任务经验中自动提炼并复用技能,实现持续进化,越用越。

热心网友
05.18
具身智能两大世界第一揭秘 行业巨头探寻其真实身份
AI
具身智能两大世界第一揭秘 行业巨头探寻其真实身份

近期,世界模型领域动态频频,竞争日趋白热化。 李飞飞教授创立的具身智能公司 World Labs 高调发布了「Spark 2 0」模型;几乎同时,阿里巴巴也推出了自家的世界模型「快乐生蚝」。此外,Physical Intelligence 公司发布了新模型 π 0 7,重点强调了其在未见任务上的组合

热心网友
05.18
豆包机器人亮相马拉松引热议 抽象设计被调侃全身是腿
AI
豆包机器人亮相马拉松引热议 抽象设计被调侃全身是腿

近日,2026北京亦庄机器人半程马拉松赛事现场,一款造型独特的机器人意外成为焦点,在网络上引发了广泛讨论。这款被网友昵称为“豆脚”的机器人,以其极具辨识度的外观和有趣的行走姿态,迅速走红。 “豆脚”机器人的创意来源于抖音平台的虚拟IP“豆包”。其创作者、抖音博主“同济子豪兄”基于高擎动力的小派机器人

热心网友
05.18
对话王潜:一个月后机器人将进入家庭接单服务
AI
对话王潜:一个月后机器人将进入家庭接单服务

“跑马拉松的机器人和我们,完全是两个领域。我们和做语言模型的公司,距离反而更近。” 就在不久前,一场机器人马拉松吸引了无数目光。那些拥有刀锋般双足的机器人,跑出了超越人类的速度。然而,在自变量科技CEO王潜看来,这更多是硬件能力的展示,而真正的战场,在于“大脑”。 “硬件在中国,从来都不是壁垒。今天

热心网友
05.18
Figure机器人全天候直播演示 惊艳表现与质疑声并存
业界动态
Figure机器人全天候直播演示 惊艳表现与质疑声并存

FigureAI三台人形机器人在物流仓库进行了超40小时全自主分拣直播,处理数千件包裹并自主充电交接。直播旨在回应对其实用性的质疑,展示其在工业场景中的稳定性与操作能力。尽管其自适应抓取与异常处理表现突出,完全自主性仍存争议。目前国内外多家公司已在物流领域部署类似机器人。

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

DeepMind科学家深度解析人工智能为何无法具备人类意识
AI
DeepMind科学家深度解析人工智能为何无法具备人类意识

今年三月,谷歌DeepMind高级科学家Alexander Lerchner发表了一篇重磅论文,其核心结论清晰而深刻:基于算法的符号操作在结构上注定无法产生真正的意识——无论未来模型规模如何庞大、架构如何精巧,甚至是否为其配备仿生身体,这一根本性限制或许都无法被跨越。 仔细审视这一论断,它并非一个关

热心网友
05.19
微软东南大学合作研发AI助手实现拖拽绘图超越鼠标点击
AI
微软东南大学合作研发AI助手实现拖拽绘图超越鼠标点击

研究针对AI助手难以执行复杂屏幕操作的问题,构建了CUActSpot评测基准,通过代码渲染自动生成含精确坐标的多样化训练数据,并训练了一个40亿参数模型。实验表明,提升训练数据多样性比单纯扩大数据规模更能有效增强模型通用操作能力,并展现出跨任务泛化潜力。

热心网友
05.19
2026年迷你世界5月17日最新激活码领取
游戏攻略
2026年迷你世界5月17日最新激活码领取

2026年5月17日,《迷你世界》发放专属免费激活码,玩家可凭兑换码领取特色皮肤、迷你币及稀有道具等精美游戏物品。

热心网友
05.19
2026年迷你世界5月15日最新激活码免费领取
游戏攻略
2026年迷你世界5月15日最新激活码免费领取

《迷你世界》于2026年5月15日发布全新激活码,玩家可凭兑换码领取酷炫角色装扮、迷你币及稀有道具,请及时复制有效激活码前往游戏内使用。

热心网友
05.19
2026年我的世界最新兑换码5月17日免费领取
游戏攻略
2026年我的世界最新兑换码5月17日免费领取

《我的世界》于2026年5月17日发布免费兑换码EMMMyxhjVHMApsb2,可兑换游戏道具与装饰。兑换码常有时间或次数限制,请尽快使用。更多兑换码可查看官方汇总页面。

热心网友
05.19