Nature封面:人类职业选手“线下首败”,这个AI乒乓球机器人打出16个Ace球
从数字棋手到物理球手:AI在真实世界的里程碑式突破
回顾人工智能的“竞技史”,仿佛一场跨越数十年的升级打怪:1997年,深蓝在国际象棋棋盘上击败卡斯帕罗夫;2016年,AlphaGo在围棋领域征服李世石;再到2024年,Gran Turismo Sophy在虚拟赛道上超越职业车手。AI在数字世界里,一次次刷新着“超人”般的表现记录。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
然而,一个更根本的难题始终横亘在前:如何将这种数字世界的卓越能力,无缝迁移到充满不确定性、连续变化的真实物理世界?这,就是所谓的“物理AI”挑战,也是整个AI与机器人领域尚未完全攻克的堡垒。
乒乓球,堪称检验这一挑战的绝佳试金石。想想看:小球飞行速度极快,旋转复杂莫测,轨迹瞬息万变。选手必须在毫秒之间,完成“看球-思考-挥拍”的完整闭环。正因如此,以往的乒乓球机器人研究,大多停留在“合作对打”的演示阶段。在正式比赛规则下,它们从未达到业余以上水平,更别提挑战人类精英了。
如今,局面被改写了。
Sony AI团队及其合作者带来了一个标志性突破。就在近期,首个能在竞技体育中击败人类精英选手的物理AI机器人——Ace,登上了权威期刊《自然》(Nature)的封面。

论文链接:https://www.nature.com/articles/s41586-026-10338-5
根据论文描述,Ace是在完全真实的场景下完成挑战的:遵循国际乒联(ITTF)规则,站在真实的球台旁,使用真实的球拍和乒乓球。它的对手是3位人类精英选手,结果Ace取得了胜利。更令人惊讶的是,在面对2位日本职业联赛(T.League)现役选手时,Ace在7局比赛中也成功拿下了1局。
还有一个后续进展值得一书:在这篇《自然》论文提交后的一场新比赛中,Ace的能力再度精进,成功击败了一名职业选手。

Ace的制胜法宝是什么?或许和多数人想象的不同,它并非依靠超越人类的“暴力”击球速度。其核心优势在于两点:一是制造多种旋转的能力,二是稳定回球的一致性。这恰恰揭示了高水平乒乓球的精髓——控制与变化,而不仅仅是力量。
“这项突破的意义,早已超越了乒乓球这项运动本身。”Sony AI首席科学家Peter Stone评价道,“它代表了AI研究的一个标志性时刻,首次证明了AI能够在复杂、快速、要求精准与速度的现实环境中,有效完成感知、推理与行动的完整链条。一旦AI能在这些条件下达到人类专家水平,一整类过去无法实现的现实世界应用大门将被开启。”
在同期发表的新闻与观点文章中,巴西航空技术学院的Carlos H. C. Ribeiro与坎皮纳斯州立大学的Esther Colombini写道:尽管随着自主系统持续进步,Ace未来某天也可能被超越。但毋庸置疑,与深蓝一样,Ace是一个重要的里程碑,它展现了能够与物理环境进行高质量、高竞争力交互的下一代智能体的巨大潜力。
Ace是怎样练成的?
打造一个能达到人类职业水准的乒乓球机器人,绝非易事。它需要实时精准地感知环境、快速做出决策,并以毫秒级的精度执行动作。任何一个环节的延迟或误差,都可能导致回球失误。
针对这些严苛要求,研究团队为Ace精心设计了三大核心模块:“高速感知系统”、“基于强化学习的控制系统”以及“高动态响应的机械臂硬件”。三者协同,才铸就了球台旁的这位AI球手。

图|Ace系统。其中,感知系统通过普通摄像头定位球的位置,并借助3套注视控制系统估算球的旋转速率;这些信息被基于AI的控制系统利用,指导比赛中的发球与回球;控制系统的决策则由1个配备8个独立控制关节的机械臂完成。
1.感知:破解旋转密码
乒乓球的旋转,是高水平对决中制造威胁的灵魂所在,也一直是机器人感知的难点。Ace的感知系统,在这个关键点上取得了有效进展。
具体来说,球的3D位置由布置在球台周围的9台主动像素传感器相机测量,实现全场覆盖。而更关键的旋转信息,则由3套独立的“注视控制系统”负责。每套系统包含一台事件相机和一对反射镜,能主动跟踪球体,让事件相机始终“盯”着球,从而实时捕捉其旋转特征。
旋转角速度的估算最终由卷积神经网络完成。位置与旋转信息合并后,便形成了下游控制系统决策的“眼睛”。

图|Ace系统设置
2.控制:学会“思考”与“出手”
Ace的控制策略,核心是“模型无关”的强化学习。这意味着,它不需要事先被灌输“球在空中如何飞行”、“球拍如何触球”这些复杂的物理公式,而是通过在仿真环境中进行海量的对打练习,直接从数据中学习动作策略。
训练采用“决策-评分”架构:决策模块负责给出动作,评分模块则评估该动作带来的长期收益,两者不断交替优化。通过这个过程,Ace不仅学会了稳定回球,更能主动为回球赋予特定的旋转,例如极具攻击性的上旋。
发球环节则被单独处理。根据规则,发球需要抛球后击打。Ace的抛球动作源自对人类示范的学习,并针对机器人特性进行了适配,确保符合最新规则。其发球策略库则通过遗传算法筛选:在与人类陪练的合作训练中,任何一种发球方式,只要在20次尝试中成功率超过95%,就会被纳入Ace的“武器库”。比赛时,Ace会根据策略的不相似性或历史胜率,从库中智能选择发球方式。
3.硬件:为速度与精度而生的机械臂
再聪明的“大脑”,也需要强大的“肢体”来执行。Ace的机械臂拥有8个自由度,包括2个直线关节和6个旋转关节,足以灵活控制球拍的位置、朝向及击球速度。
为了匹配职业级运动需求,其末端执行器最高速度被设定为20米/秒,工作空间覆盖3.6×3.6平方米,确保能完成快速移动与大范围救球。机械臂的连杆通过拓扑优化减轻重量,并采用高强度轻质材料Scalmalloy进行3D打印,从而在高速运动中兼具稳定性和低惯性。
末端执行器配备了改装球拍,胶皮和底板均选用专业型号,同时集成了一个小型托杯,用于持球发球。为了极致性能,Ace采用了低延迟控制架构,所有执行器以1毫秒周期同步运行,并与视觉系统时钟同步。即便在最高速度下,位置跟踪延迟也能被控制在5毫秒以内。
真实表现:征服精英,挑战职业
2025年4月,真正的考验到来。在完全遵循ITTF规则的奥运标准场地内,使用最新比赛用球,并由持牌裁判执裁,Ace迎来了与5位精英选手和2位职业选手的正式对决。
所有人类选手均拥有10年以上高强度训练经验,且从未与Ace交手过。Ace自身也未针对任何特定选手进行过训练,确保比赛的公平性。

结果如何?如下图所示,Ace在与5位精英选手的“三局两胜”制比赛中,取得了3胜2负的战绩(总比分赢7局输6局)。而在与2位职业选手的“五局三胜”制比赛中,虽然均告失利,但在7局比赛中顽强地赢下了1局。

图|评估结果
数据分析揭示了更多细节:Ace击球产生的球速和旋转强度,均已落入专业比赛区间,证明它具备了主动进攻的能力。其从球落台到挥拍击球的反应时间,也处于高水平竞技范围,体现了快速的感知-执行闭环。
进一步测试表明,Ace能回击各种旋转来球。即使在高达450 rad/s的旋转条件下,其回球率仍能稳定保持在75%以上,这项处理旋转的能力,已超过了此前竞技乒乓球机器人的公开记录。
面对精英选手时,Ace通过发球直接得分(即“Ace球”)高达16次,而精英选手仅从Ace身上拿到8次此类得分。这凸显了其发球策略的威力。
一个尤为有趣的场景出现在球擦网之后——这种在仿真训练中几乎不会出现的意外。数据显示,Ace在球撞网后仅49毫秒就开始调整关节速度和球拍轨迹,并成功将这种“异常球”回击过去。这初步表明,Ace的低延迟感知-控制链路,具备了一定的对未预见情况的泛化能力。
不足与未来方向
当然,必须承认,Ace系统仍存在局限与不足。
正如Ribeiro和Colombini在评论文章中指出的,Ace通过多个外部视角同时观察场地的方式,与人类选手的单一主观视角存在本质差异。因此,它距离真正意义上的“拟人化乒乓球选手”还有一段路要走。
研究团队也坦言,Ace的策略是在仿真中训练并零样本迁移到真实世界的。其中最大的挑战之一,在于对人类对手行为的建模。在高维物理空间中,人类行为难以精确建模,这意味着“赢球”这个最终目标无法直接作为训练信号,训练中只能使用替代目标函数。
未来的改进方向已然清晰。一方面,可以引入乒乓球机器人研究中关于人类对手建模的成果,帮助系统更好地理解战术与策略层面。另一方面,结合在线学习机制,让Ace能在与真实世界的持续交互中不断迭代、自我提升。
尽管如此,正如Sony AI苏黎世负责人兼Ace项目负责人Peter Dürr所言,这项突破无疑凸显了物理AI智能体执行实时交互任务的巨大潜力。它标志着我们朝着打造能够广泛应用于高速、精准、实时人机交互场景的机器人,迈出了坚实而重要的一步。
相关攻略
从数字棋手到物理球手:AI在真实世界的里程碑式突破 回顾人工智能的“竞技史”,仿佛一场跨越数十年的升级打怪:1997年,深蓝在国际象棋棋盘上击败卡斯帕罗夫;2016年,AlphaGo在围棋领域征服李世石;再到2024年,Gran Turismo Sophy在虚拟赛道上超越职业车手。AI在数字世界里,
ACE Studio产品介绍 在音乐制作的数字化浪潮中,一个难题始终存在:如何快速、低成本地获得高质量的人声?ACE Studio的出现,或许就是那道标准答案。它是一款专业的AI音乐生成平台,其核心使命,就是为创作者提供媲美录音室水准的AI人声生成服务。简单来说,它能让你的旋律和歌词,瞬间“开口”唱
4月新机前瞻:天玑9500旗舰对决,直屏与散热的“硬核”较量 4月的手机圈,看来是准备在性能赛道上来一场“硬碰硬”了。根据知名数码博主 @数码闲聊站 的最新爆料,一款搭载天玑9500芯片的新机即将登场,核心规格颇具看点。 具体来看,这款新机将配备一块6 78英寸的1 5K分辨率直屏,刷新率直接拉到了
【CNMO科技消息】4月7日,CNMO注意到,博主“数码闲聊站”疑似曝光了一加Ace 6至尊版的核心配置。一加Ace 5至尊版 最核心的处理器上,一加Ace 6至尊版预计将搭载联发科的天玑95
【CNMO科技消息】4月7日,CNMO注意到,博主“数码闲聊站”疑似曝光了一加Ace 6至尊版的核心配置。一加Ace 5至尊版 最核心的处理器上,一加Ace 6至尊版预计将搭载联发科的天玑95
热门专题
热门推荐
MySQL主从延迟:别被“0延迟”骗了,这才是真实监控与排查指南 说起MySQL主从延迟,很多人的第一反应就是去查SHOW SLA VE STATUS里的那个Seconds_Behind_Master。但经验告诉我们,这个最显眼的数字,往往也是最会“撒谎”的。它明明显示为0,业务侧却反馈数据没同步过
MySQL GET_LOCK():一个被误解的“分布式锁”工具 MySQL GET_LOCK() 能不能当分布式锁用 开门见山地说,直接把它当作生产级的分布式锁来用,风险极高。这个函数的设计初衷,其实是为了在单个MySQL实例内部,进行一些轻量级的协作控制。为什么这么说?原因很具体:首先,GET_L
mysql如何查看当前执行的进程_使用show processlist查看状态 show processlist 返回的 State 字段到底代表什么 首先得澄清一个普遍的误解:State 字段显示的可不是什么“进程状态”,它真正揭示的,是当前线程在执行 SQL 时,其内部正处于哪个**具体的工作阶
在加密货币那个充满野性与想象力的世界里,“屎币”(Shiba Inu)和狗狗币(Dogecoin)绝对是两个无法被忽视的“异类”。它们从网络迷因中诞生,因社区狂欢而崛起,最终在残酷的市场博弈中,演化出了一套属于自己的独特生存法则。这套法则既包含了加密货币的底层逻辑,又被“去中心化”、“社区驱动”这些
MySQL访问控制:GRANT与防火墙的协同策略 MySQL GRANT 语句中指定 IP 时,为什么 localhost 和 127 0 0 1 不等价? 这里有个关键细节常被忽略:MySQL的用户账户其实是一个二元组,由 user @ host 共同构成。其中, localhost 是一个特殊标





