谷歌DeepMind推出Gemini Robotics-ER 1.6:机器人“看懂”世界的能力再进化
周二,谷歌DeepMind放了个大招,正式推出了Gemini Robotics-ER 1.6。这可不是一次普通的版本迭代,而是一次旨在让机器人真正“开窍”的升级。简单来说,这个新模型的核心使命,就是通过大幅增强机器人的“具身推理”能力,让它们能应对更复杂的现实世界任务。它把功夫主要下在了三个关键环节:空间理解、任务规划,以及如何判断任务是否成功完成。这标志着AI驱动的机器人技术迈出了扎实的一步,也意味着企业离大规模采用自主系统,可能又近了一些。
最安全的虚拟币交易平台推荐:
- OKX(欧易交易所)>>>进入官网<<< >>>官方下载<<<
- Binance(币安交易所)>>>进入官网<<< >>>官方下载<<<
性能显著提升:从“看得见”到“看得懂”
那么,这次升级到底带来了哪些实在的提升?数据显示,在空间和物理推理任务上,新模型的表现不仅超越了它的前代产品,甚至比Gemini 3.0 Flash还要出色。一个颇具代表性的新能力是:Gemini Robotics-ER 1.6现在能够读取复杂的仪表和视镜了。可别小看这个功能,它背后是谷歌DeepMind与机器人领域的“明星选手”波士顿动力公司携手合作的成果,目的就是为了精准解决那些棘手的工业场景需求。
在识别安全隐患的测试中,新模型的优势体现得更为直观。与Gemini 3.0 Flash相比,它在基于文本的场景中性能提升了6%,而在基于视频的场景中,提升幅度达到了10%。对于开发者而言,这些增强功能现在已经可以通过Gemini API和Google AI Studio来获取和使用。
从实验室走向工厂:合作落地进行时
模型发布只是第一步,真正的考验在于落地。目前,实际部署工作已经启动。波士顿动力公司正将Gemini和Gemini Robotics-ER 1.6集成到其Orbit AIVI-Learning平台中,注册客户从4月8日起就能开始体验这一过渡。
对于这次合作的意义,波士顿动力公司Spot副总裁兼总经理Marco da Silva说得很明白:“仪器读取和更可靠的任务推理等功能,将使Spot机器人能够完全自主地观察、理解并应对现实世界的挑战。” 这句话点出了关键:自主性,正是这次升级追求的终极目标。
AI机器人技术的新篇章:研究与应用融合
可以说,此次合作标志着一个清晰的转向:人工智能研究正从纯实验探索,大步走向实际的工业应用。增强后的空间推理和仪器读取能力,将直接使机器人能够接手那些以往必须依赖人工监督的重复性工作,比如设备维护、安全巡检和环境监控。这不仅仅是效率的提升,更是工作模式的变革。
谷歌方面也指出,这次合作巧妙地结合了双方的优势:一方面是波士顿动力公司在商用机器人领域深厚的积累——其Spot机器人早已在建筑工地和工业设施中证明了自身的价值;另一方面则是谷歌前沿的AI技术。将先进的AI“大脑”装入经过市场验证的成熟“身体”,这种软硬件的深度融合,无疑为各行各业加速部署自主系统铺平了道路。
回顾来看,谷歌在AI机器人领域的布局一直在稳步推进,从早期开发能够自主思考和联网搜索的机器人,到如今与波士顿动力联手,以及后者发布商用Atlas人形机器人的公告,一条从技术研发到产业赋能的路径已经清晰可见。Gemini Robotics-ER 1.6的推出,正是这条路径上一个新的里程碑。
