
同济大学教授、自主智能无人系统全国重点实验室副主任何斌作主题分享。孙宁摄
人工智能的发展脉络正日益清晰。从早期的判别式智能,到如今风靡全球的生成式智能,下一波浪潮将涌向何处?在近期举办的“2026人民网数据智能伙伴大会”上,同济大学何斌教授提出了前瞻性观点:继智能体时代之后,我们将迈向物理AI或自主智能的新纪元。这意味着,具身智能必须突破实验室的局限,学会与社会环境深度融合与协作,最终与人类携手创造价值。
这一判断背后,折射出一个亟待破解的现实矛盾。尽管当前机器人在运动控制和基础行动能力上取得了显著进步,但真正能够大规模融入社会生产生活体系的却凤毛麟角。瓶颈究竟在哪里?何斌教授指出了几个关键挑战:真实世界的复杂程度远超受控的实验室环境,完整的数据闭环难以构建,而“从仿真到现实”的迁移鸿沟依然显著存在。
要让机器人真正走入社会,仅具备“动手”能力是远远不够的,它们还必须学会“为人处世”。何斌教授提出了一个核心理念:重新定义社会训练。这意味着,训练内容不应仅局限于物理技能,还必须涵盖情感交互、陪护关怀、助老助残等社会性行为能力。最终目标是构建一个融合物理过程、社会关系与正向价值反馈的统一训练闭环。简言之,未来的机器人既需要灵巧的“肢体”,更需要具备协作精神与关怀意识的“心智”。
那么,这种社会化的训练具体应如何实施?何斌教授强调,训练的本质不仅是动作训练,更是社会交互训练。训练对象应是一个由人、机器、环境与规则共同构成的多智能体系统。因此,数据采集就不能只包含动作指令,还必须广泛纳入交互意图、社会反馈、失败案例、关系网络乃至社会规则等多元信息,并将其整合进统一的训练框架中。评价一个智能体是否合格,标准也将更为综合:它是否提升了人类的安全感与工作效率?是否赢得了用户的信任?能否灵活适应多样化场景?其价值观与社会行动能力是否经得起检验?
愿景固然宏大,但实现路径上的挑战不容忽视。何斌教授分析了三大难点:首先是资源分散,缺乏对真实物理过程的高效模拟;其次是著名的“仿真到现实”鸿沟,虚拟空间的训练成果往往难以适配复杂多变的真实世界;最后是数据稀缺,尤其是缺乏人、机、环境三者深度共融的复杂交互数据。要跨越这些障碍,或许需要一场基础设施层面的变革——即重新定义开源的物理智能训练场。这要求我们建立统一的数据接口与训练描述语言,实现全域数据的高效采集,并构建一个开放的协同生态,为具身智能的社会化发展铺平道路。
更进一步,我们需要构建一个覆盖全生态、全栈的技术闭环。何斌教授描绘的蓝图是,将学科知识、网络数据、文本图像、人类意图数据与真实物理世界采集的多模态数据,全部整合到一个统一的交互与训练环境中。这不仅能够实现全栈真实的交互数据闭环,还能推动高保真物理世界仿真引擎的建设,并持续提升智能体的在线学习与自适应优化能力。
展望实际应用,前景广阔。从智能制造车间到社会公共服务,机器人未来的应用场景将不断拓展。这要求我们形成从物理场数据采集,到物理闭环验证,再到能力闭环迭代的完整技术链条。工业场景因其规范性与可重复性,将成为机器人训练与落地应用的理想“练兵场”。同时,我们还需建设安全、可信的多体协同决策训练环境,用以精准刻画真实的人机社会交互,模拟涉及意图理解、价值对齐、安全性与可信度评估的复杂场景。
总而言之,推动机器人从实验室走向街头巷尾、千家万户,是下一阶段发展的关键目标。通过打造面向具身智能的新型基础设施场景,建设开源、标准化、模块化的产业技术底座,我们才能稳步推进具身智能的社会化应用,真正开启物理AI发展的新篇章。这条路虽任重道远,但方向已然明晰,接下来需要的是脚踏实地,协同共进。
