智元Act2Goal方案：机器人如何从单张图像学会执行任务

时间：2026-01-05 12:57

在机器人领域，一个看似简单的任务往往需要复杂的指令和反复调试。但智元具身研究中心给出了一种颠覆性的答案：给机器人一张 "目标照片 "，它就能自己想办法把面前的场景变成照片里的样子。智元于近日正式发布Ac

在机器人领域，一个看似简单的任务往往需要复杂的指令和反复调试。但智元具身研究中心给出了一种颠覆性的答案：给机器人一张"目标照片"，它就能自己想办法把面前的场景变成照片里的样子。

智元于近日正式发布Act2Goal方案，这不仅是一个新的操作算法，更是一种让机器人"以终为始"的全新思维方式。与传统机器人机械地执行死板指令不同，Act2Goal引入了"目标条件世界模型"，使机器人不再只是"看一步走一步"，而是拥有了预见未来的能力——在真正动手之前，它已经在大脑中构建了从现状通往目标的完整因果链条。

从"看一步走一步"到"以终为始"

在传统机器人操作中，系统通常只关注当前状态与目标状态，而缺乏对两者之间任务过程的显式建模。主流方法多采用直接映射的范式，将当前观测与目标状态输入策略网络以预测动作，这使得机器人难以判断执行进度，也容易在任务延长或环境变化时出现误差累积。

Act2Goal则通过在动作生成之前引入目标条件世界模型，对从当前状态到目标状态的演化过程进行建模，并生成一系列中间视觉状态作为任务进程的结构化表征，为机器人动作提供明确操作锚点。

"我们相信，这种‘先理解世界如何变化，再决定如何行动’的思路，将为更通用、更可靠的机器人系统提供重要支撑。"智元技术团队解释道。

零样本泛化与自我进化能力

Act2Goal最令人惊叹的特性在于其"零样本泛化能力"和"自我进化"本能。系统能够在从未见过的环境和物体面前，展现出惊人的零样本泛化能力，无需人类手把手教（无奖励信号），就能在真实世界的交互中快速"复盘"自己的行为轨迹。

实验数据显示，面对高难度的陌生任务，Act2Goal仅需数分钟的在线自我磨练，成功率就能从30%提升至90%。这一性能提升速度，远超传统机器人学习模式。

"这不仅仅是技术的进步，更是机器人认知方式的革命。"一位具身智能行业专家表示，"它让机器人从＇执行者＇转变为＇思考者＇。"

Act2Goal的训练过程分为两个阶段：首先通过大规模离线模仿学习进行训练，系统微调预训练的世界模型，使其能够生成从当前状态到目标状态的多视角、多尺度视觉轨迹；随后引入在线自我提升机制，利用回顾性经验重放（HER）实现自主性能优化。

在执行过程中，机器人会自动收集每一步的状态、动作及执行结果，并将轨迹重新标注为新的目标示例，存入回放缓冲区。无论任务是否成功完成，系统都能利用这些数据进行端到端微调，仅更新新增的LoRA层参数，基础模型保持冻结。

"部署Act2Goal模型的机器人在多个域外任务上展现出色性能，甚至能在线练习绘制未见过的图案，持续提升性能。"智元技术团队表示。

从实验室到真实世界的跨越

Act2Goal的核心贡献在于重新审视了目标条件操作中的一个基本问题：从当前状态到目标状态之间，机器人是否真正理解过程？通过在策略中显式引入目标条件世界模型，并结合多尺度时间建模与深度融合机制，Act2Goal为目标条件机器人操作提供了一种新的建模范式。

"我们相信，这种＇先理解世界如何变化，再决定如何行动＇的思路，将为更通用、更可靠的机器人系统提供重要支撑。"智元研究团队表示。

随着智能制造、服务机器人和家庭自动化需求的不断增长，Act2Goal所代表的技术路线有望成为下一代机器人系统的标准配置，推动机器人从"工具"向"伙伴"的转变，让机器真正"懂"得如何达成目标。

从工业端来看，装配、分拣等长时序任务中，机器人无需反复调试程序就能适配不同批次产品，可大幅提升生产效率；从消费端而言，服务机器人能快速理解用户的模糊需求（如“把桌子摆成照片里的样子”），无需用户学习复杂指令，加速走进家庭和门店。

当前，具身智能赛道正处于“技术比拼转向商用落地”的关键阶段，Act2Goal的推出，不仅强化了智元的技术壁垒，更可能推动行业从“单一任务机器人”向“通用智能机器人”跨越。随着方案在智元现有机器人产品线的适配，其商业化效果或将在2026年逐步显现，进一步改写全球具身智能的竞争格局。

采写：南都·湾财社记者胡雯雯

来源：https://www.163.com/dy/article/KIGOGTBV05129QAF.html

动作 act 大模型真实世界智元ac 智能机器人

上一篇电动车续航痛点，车企如何破解里程焦虑困局？ 下一篇CES 2026：Ludens AI伴侣机器人拥抱后情感升温

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时，同比增长5 0%。充换电服务业用电增速高达48 8%，信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市联体风扇售价429元

追风者冰川360S25液冷散热器售价429元，三联一体风扇便捷安装，冷头小体积纯铜底座噪音18dB，风扇转速300-2000RPM、风量75CFM、静压2 96mmAq，五年质保漏液包赔。

科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映，GooglePlayServices后台耗电异常，电量占比最高达99 97%，远超正常水平，严重影响续航。目前故障原因不明，谷歌尚未发布官方声明。

科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足盼新CEO改进

罗永浩批评苹果iOS27创新不足，称仅有双iPhone同号、音量分离等数十项细节改进，认为库克时代缺乏突破性创新，股市虽好但消费者只能被迫接受挤牙膏式升级。

科技数码 · 2026-06-29

年国产车出口710万辆，两家车企销量破百万

2025年国产汽车出口总量达710万辆，同比增长21%。奇瑞以134万辆居首，比亚迪105万辆次之，上汽乘用车出口占比60%最高，长城出口51万辆。吉利、长安等主流品牌同步增长，小鹏、零跑等新兴品牌海外拓展加速。