何斌谈具身智能新基建如何推动物理AI技术发展与应用

时间：2026-05-10 11:18

同济大学教授、自主智能无人系统全国重点实验室副主任何斌作主题分享。孙宁摄人工智能的发展脉络正日益清晰。从早期的判别式智能，到如今风靡全球的生成式智能，下一波浪潮将涌向何处？在近期举办的“2026人民网数据智能伙伴大会”上，同济大学何斌教授提出了前瞻性观点：继智能体时代之后，我们将迈向物理AI或自主

同济大学教授、自主智能无人系统全国重点实验室副主任何斌作主题分享。孙宁摄

人工智能的发展脉络正日益清晰。从早期的判别式智能，到如今风靡全球的生成式智能，下一波浪潮将涌向何处？在近期举办的“2026人民网数据智能伙伴大会”上，同济大学何斌教授提出了前瞻性观点：继智能体时代之后，我们将迈向物理AI或自主智能的新纪元。这意味着，具身智能必须突破实验室的局限，学会与社会环境深度融合与协作，最终与人类携手创造价值。

这一判断背后，折射出一个亟待破解的现实矛盾。尽管当前机器人在运动控制和基础行动能力上取得了显著进步，但真正能够大规模融入社会生产生活体系的却凤毛麟角。瓶颈究竟在哪里？何斌教授指出了几个关键挑战：真实世界的复杂程度远超受控的实验室环境，完整的数据闭环难以构建，而“从仿真到现实”的迁移鸿沟依然显著存在。

要让机器人真正走入社会，仅具备“动手”能力是远远不够的，它们还必须学会“为人处世”。何斌教授提出了一个核心理念：重新定义社会训练。这意味着，训练内容不应仅局限于物理技能，还必须涵盖情感交互、陪护关怀、助老助残等社会性行为能力。最终目标是构建一个融合物理过程、社会关系与正向价值反馈的统一训练闭环。简言之，未来的机器人既需要灵巧的“肢体”，更需要具备协作精神与关怀意识的“心智”。

那么，这种社会化的训练具体应如何实施？何斌教授强调，训练的本质不仅是动作训练，更是社会交互训练。训练对象应是一个由人、机器、环境与规则共同构成的多智能体系统。因此，数据采集就不能只包含动作指令，还必须广泛纳入交互意图、社会反馈、失败案例、关系网络乃至社会规则等多元信息，并将其整合进统一的训练框架中。评价一个智能体是否合格，标准也将更为综合：它是否提升了人类的安全感与工作效率？是否赢得了用户的信任？能否灵活适应多样化场景？其价值观与社会行动能力是否经得起检验？

愿景固然宏大，但实现路径上的挑战不容忽视。何斌教授分析了三大难点：首先是资源分散，缺乏对真实物理过程的高效模拟；其次是著名的“仿真到现实”鸿沟，虚拟空间的训练成果往往难以适配复杂多变的真实世界；最后是数据稀缺，尤其是缺乏人、机、环境三者深度共融的复杂交互数据。要跨越这些障碍，或许需要一场基础设施层面的变革——即重新定义开源的物理智能训练场。这要求我们建立统一的数据接口与训练描述语言，实现全域数据的高效采集，并构建一个开放的协同生态，为具身智能的社会化发展铺平道路。

更进一步，我们需要构建一个覆盖全生态、全栈的技术闭环。何斌教授描绘的蓝图是，将学科知识、网络数据、文本图像、人类意图数据与真实物理世界采集的多模态数据，全部整合到一个统一的交互与训练环境中。这不仅能够实现全栈真实的交互数据闭环，还能推动高保真物理世界仿真引擎的建设，并持续提升智能体的在线学习与自适应优化能力。

展望实际应用，前景广阔。从智能制造车间到社会公共服务，机器人未来的应用场景将不断拓展。这要求我们形成从物理场数据采集，到物理闭环验证，再到能力闭环迭代的完整技术链条。工业场景因其规范性与可重复性，将成为机器人训练与落地应用的理想“练兵场”。同时，我们还需建设安全、可信的多体协同决策训练环境，用以精准刻画真实的人机社会交互，模拟涉及意图理解、价值对齐、安全性与可信度评估的复杂场景。

总而言之，推动机器人从实验室走向街头巷尾、千家万户，是下一阶段发展的关键目标。通过打造面向具身智能的新型基础设施场景，建设开源、标准化、模块化的产业技术底座，我们才能稳步推进具身智能的社会化应用，真正开启物理AI发展的新篇章。这条路虽任重道远，但方向已然明晰，接下来需要的是脚踏实地，协同共进。

来源：https://www.163.com/dy/article/KSIDU2BA0514R9M0.html

具身智能