首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
人形机器人首次展示叠衣服技能:仅扩充数据集即实现灵巧操作

人形机器人首次展示叠衣服技能:仅扩充数据集即实现灵巧操作

热心网友
90
转载
2025-08-31

Figure 人形机器人首秀,靠神经网络叠衣服

在没有任何架构改变、仅增加了数据的情况下,就让原本在物流场景干活的它,轻松习得了新技能。

能够看到,在人类拿给他衣服时,不仅有眼神交流,拿完后它点了点头,比了个「点赞」的手势。

好开心呀,又要开始干活了!

随后,它的一双灵巧手十分顺滑地从杂乱的毛巾堆里挑出毛巾,然后进行折叠的操作 ——

用拇指描边、拎角、理顺褶皱再叠起来,中间还实时调整操作。

整个过程完全采用端到端的方式运行 —— 从视觉和语言输入到流畅、精确的运动控制。

不过有网友表示,咋擎天柱 10 个月前就会叠衣服了。

Figure 人形机器人叠衣服

两个月前,Figure 机器人展现了他们在物流场景包裹分拣的能力,整个过程长达一小时。对于各种形态的包裹,它都能进行识别、抓取、翻转然后运送到传送带上。其灵活性和速度接近人类水平。

现在同样的模型、同样的机器人却在处理一个完全不同的任务 —— 叠衣服 / 毛巾。

叠衣服对人来说可能平淡无奇,但对于人形机器人来说,这却是最具挑战性的灵巧操作任务之一。

相较于包裹来说,衣服更易变形,形状也更加多样,弯曲难以预测,而且容易起皱或缠结。

它没有固定的几何形状需要记住,也没有单一的“正确”抓握点。即使是手指轻微的滑动,也可能导致衣服起皱或掉落。

因此要完成这样一个操作,不仅需要机器人仔细地观察,还需要精细协调的手指控制,以追踪边缘、捏住角落、抚平表面,并实时调整。

完成此次任务,Figure 展现了三项关键成果:

  • 这是人形机器人的首次尝试。这是首个拥有多指手的人形机器人,能够利用端到端神经网络完全自主地折叠衣物。

  • 架构相同,仅数据变化。Helix 架构直接应用于衣物 / 毛巾折叠,无需修改模型或训练超参数,唯一的变化是数据集。

  • 自然的多模态交互。除了折叠之外,Helix 还学会了与人互动时保持眼神交流、引导视线以及运用手势。

在完成这些功能时,并没有明确的对象表征、完全采用端到端方式来运行。主要也是因为像毛巾这种高度可变性的物体,构建这样的表征既脆弱又不可靠。

接下来,他们计划在现实世界数据规模扩大的基础上,会在机器人灵活性、速度和泛化能力方向持续提升。

Helix 架构立大功

此次虽然没有任何变化,但依旧起着关键作用的就是它的 Helix 架构

Helix 是 Figure 与 OpenAI 分道扬镳后的第一个成果,是一个适用于通用人形机器人控制的端到端“视觉-语言-动作”模型(VLA),能让机器人像人一样感知、理解和行动。

Helix 由两个系统组成,两个系统经过端到端训练,并且可以进行通信。

它通过单一统一模型即可在各种任务中实现强大性能,仅使用一组神经网络权重,就能在不同容器中精准拾取放置物品、灵活操控抽屉与冰箱、协调多机器人完成灵巧交接,甚至能熟练操控数千种新物体。

而在上次包裹分拣的任务,研究团队对 Helix 的视觉电机策略的架构进行了针对性改进,引入了新的内存和传感模块,能更好地帮助机器人感知环境变化。

具体来说,可以分为视觉记忆、状态历史、力反馈三个部分:

视觉记忆,Helix 配备了一个新的内存模块,可以从系列视频帧中组合特征,再形成短期视觉记忆。

期间,机器人还可以记住它已经检查过的包装侧面,避免重复检查,提高成功率。

从本质上讲,视觉记忆为 Helix 提供了时间背景感,可以更有效地通过多次小型旋转或视点调整来查找条形码位置。

状态历史,该策略在固定持续时间内的动作分块中运行,也就是将连续动作序列分割为固定长度的小段进行规划和执行。

首先会观察当前状态(手、躯干和头部)并输出一小段运动轨迹,反复重新观察多次后,再将全部状态合并输入,以确保模块间的连续性。

由于状态历史记录保留了上下文,即使重新规划或面对干扰,机器人仍能保持稳健,例如当包裹抓取失败时,Helix 会以最小的延迟迅速纠正运动,显著缩短了处理时间。

力反馈,为了赋予 Helix 触感,机器人施加在环境和目标上的力,被反馈送至神经网络状态输入中,以帮助机器人动态调整运动过程,例如当它检测到与传送带接触时,会暂停向下继续运动。

通过一个闭合回路,Helix 可以实现更精准的控制,提高运动的成功率和一致性,也更能适应不同形态重量的物流包裹。

One More Thing

不过话说回来,叠衣服这件事儿确实也不稀奇。

像几个月前就 get 了这项任务的擎天柱。

前几天 WRC 上,也有像叠衣服、抓娃娃的机器人。

诶不过,前不久还是 Figure 机器人,学会了帮人洗衣服。

洗衣服、叠衣服,现在就差晾衣服,机器人就可以完成一整套动作的闭环了。

接下来,你还期待机器人能干什么家务呢?

参考链接:

  • [1]https://www.figure.ai/news/helix-learns-to-fold-laundry

  • [2]https://x.com/adcock_brett/status/1955291307758489909

本文来自微信公众号:量子位(ID:QbitAI),作者:白交,原标题《Figure 人形机器人首秀灵巧手叠衣服!神经网络架构不变,只增加数据集就搞定》

来源:https://www.ithome.com/0/875/142.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

爱普生如何用省小精技术破解时代困境实现可持续发展
业界动态
爱普生如何用省小精技术破解时代困境实现可持续发展

面对资源紧张等时代挑战,爱普生提出“省、小、精”发展理念,旨在以更少资源创造更高价值。其依托精密技术,在工业自动化、数字印刷及教育等领域提供解决方案,提升效率并减少环境负担。该理念支撑着企业实现可再生电力使用与碳中和的长期愿景,推动可持续发展。

热心网友
05.23
智元机器人基座模型升级 赋予机器人肌肉记忆能力
AI资讯
智元机器人基座模型升级 赋予机器人肌肉记忆能力

智元公司发布新一代机器人运控基座模型BFM-2,赋予机器人“肌肉记忆”。该模型使机器人能在任何姿态下自主进行高稳定性动作插补,实现动态任务闭环控制,提供更可靠灵活的运动基础。演示显示,搭载该模型的机器人被推倒后可迅速流畅地自行站起,并在过程中主动维持身体平衡。

热心网友
05.23
杭州老登买下机器人公司创业故事
AI资讯
杭州老登买下机器人公司创业故事

杭州柯林计划以不超过3亿元收购上海开普勒机器人41 57%股权,实现控股。开普勒由行业资深人士创立,聚焦工业场景,订单超4700万元,但近期营收有限且处于亏损。当前具身智能赛道融资火热,估值飙升,但行业分化加剧,缺乏商业路径的项目面临挑战。

热心网友
05.23
探访北京机器人训练中心现场实拍
科技数码
探访北京机器人训练中心现场实拍

美国媒体探访北京一处机器人训练中心,中国正系统性培训机器人进入劳动力市场。训练师通过动作捕捉等技术引导机器人学习分拣等技能,数据将联网共享以应对复杂环境。机器人已开始在餐饮、零售等行业试岗,目标是与人类协作完成危险或重复性劳动。

热心网友
05.23
京东擎天租机器人服务上线 加速拓展全域应用场景
科技数码
京东擎天租机器人服务上线 加速拓展全域应用场景

京东与擎天租达成战略合作,上线机器人租赁旗舰店。双方将围绕产品方案共建、渠道供应链赋能展开合作,提供多款机器人及场景化租赁套餐,旨在降低使用门槛,推动机器人即服务模式向消费市场普及。此次合作致力于将机器人服务标准化,并拓展至更广泛的线下应用场景。

热心网友
05.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Cursor AI代码编辑器:智能编程工具的功能与使用指南
AI教程
Cursor AI代码编辑器:智能编程工具的功能与使用指南

在追求极致效率的现代软件开发中,一款名为Cursor的AI代码编辑器正引领着开发范式的变革。它被定义为“面向未来的IDE”,其核心理念清晰而有力:将人工智能深度无缝地集成到编码工作流的每一个步骤,为开发者创造一种前所未有的“AI结对编程”体验。 Cursor sh应用场景 那么,这款AI驱动的编辑器

热心网友
05.23
美图WHEE-WHEE AI视觉创作工具使用指南与功能详解
AI教程
美图WHEE-WHEE AI视觉创作工具使用指南与功能详解

在众多AI图像生成工具中,WHEE凭借其精准的产品定位与持续的功能迭代,正成为越来越多设计师和内容创作者的首选工具。它专注于打造高品质的AI视觉素材生成器,核心使命就是帮助用户快速、高效地获得可直接使用的优质图片素材。 那么,这款AI绘图工具究竟有哪些核心优势?下面我们从其关键特性与功能设计进行深入

热心网友
05.23
NightCafe Creator AI艺术生成器:手机创作数字绘画
AI教程
NightCafe Creator AI艺术生成器:手机创作数字绘画

在AI绘画工具不断涌现的当下,一款名为NightCafe Creator的应用以其全面的AI艺术生成能力脱颖而出。它不仅是一个简单的图片处理工具,更是一个融合了多种前沿人工智能技术的创意平台,帮助用户轻松实现从构思到成品的艺术创作。 NightCafe Creator是什么? NightCafe C

热心网友
05.23
加密市场恐慌蔓延 比特币以太坊为何领跌山寨币
web3.0
加密市场恐慌蔓延 比特币以太坊为何领跌山寨币

近期加密货币市场受到宏观经济不确定性及流动性紧缩影响,比特币(BTC)、以太坊(ETH)以及多种山寨币出现明显下行走势,市场情绪趋于谨慎。 比特币近期走势分析 比特币的价格近期表现如何?简单来说,它跌破了几个市场公认的关键支撑位,而且伴随交易量的放大。这种放量下跌的信号,往往意味着多空分歧加剧。无论

热心网友
05.23
蔡司6月2日发布新品镜头技术迎来重大突破
科技数码
蔡司6月2日发布新品镜头技术迎来重大突破

蔡司宣布将于6月2日发布一款新镜头,并称其为镜头技术的重大突破,标志着全新纪元的开启。官方仅公布了产品剪影,但措辞暗示其可能带来根本性的技术升级,例如全新光学结构、先进镀膜或对焦系统改进。具体细节需待发布日揭晓。

热心网友
05.23