首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
MWC上Nakul解读工业AI新思辨:具身智能连接物理世界

MWC上Nakul解读工业AI新思辨:具身智能连接物理世界

热心网友
90
转载
2026-03-05

人工智能的演进重心,正从追逐参数规模的语言学习,转向对物理世界底层秩序的深刻建模——“世界模型”已成为行业共识,系统性智能正在取代单点技术突破,成为新一轮竞争的制高点。2026年,是量产验证与场景落地的关键窗口:产业界不再“炫技”,而是真刀真枪比拼工程化能力和场景理解能力。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

作为终端侧AI的核心玩家,近年来高通打通“云-边-端”构建混合AI体系,并在CES 2026率先亮出物理AI版图和愿景:一方面,由骁龙数字底盘驱动的智能汽车,正进化为具备情境感知与隐私保护的“出行伙伴”;另一方面,高通跃龙产品组合为机器人与工业应用注入精准感知、实时处理与敏捷行动的能力,让效率在边缘侧真正释放。

而在MWC 2026,高通的工业AI和具身智能图景进一步具象化——智能正从云端真正走入物理世界,开始服务真实世界的每一处细节。

当地时间3月3日,在2026世界移动通信大会(MWC)期间,世界互联网大会在西班牙巴塞罗那举办了以“具身智能:引领人工智能发展的新范式”为主题的专题论坛。高通技术公司执行副总裁兼汽车、工业及嵌入式物联网与机器人事业群总经理Nakul Duggal受邀发表“推动工业AI与具身智能的规模化发展”的主旨演讲。他指出,全球工业生态正经历一场由AI驱动的深刻变革,核心趋势是智能能力正从云端向边缘侧深度下沉,而“具身智能”作为AI的全新发展范式,正推动智能与物理世界深度融合。


“云-边-端”协同运行模式正快速演进,边缘侧AI崛起正重构工业运行模式。Nakul指出,AI模型从单纯依赖云端处理,发展为在边缘侧具备环境感知和自主决策能力。这一转变在移动应用、固定场景、无人化应用、不同大小的终端之中已广泛实现。他以智能眼镜为例,说明如今终端已能本地运行小型模型,完成拍照、查询并反馈结果的全过程,无需经由云端,这一技术进步彻底重构了一线工作人员的工作模式,也标志着边缘侧智能部署方式的根本性变革。

他还在演讲中强调,计算机视觉正从传统形态向视觉语言模型,并进一步向视觉-语言-行动模型(VLA模型)演进。这一演进重构了系统设计逻辑,使摄像头与连接能力得以协同工作,实现对场景的完整态势感知与分析。目前,这一能力已在边缘固定摄像头、工业网关及无人机等多元场景中快速推进,且其实际落地仅在过去24个月内完成,技术发展速度远超预期。

面对边缘侧AI几乎无限的应用场景,高通的核心策略之一是构建强大的开发者生态系统。Nakul透露,过去六个月高通完成了对开源硬件平台Arduino的收购,把边缘AI技术交到全球数百万开发者手中。通过提供从硬件平台到工具链的完整支持,赋能开发者进行数据访问、模型编程与边缘部署,并利用反馈闭环持续优化模型,从而推动复杂AI应用在广泛的工业生态系统中真正落地。


谈到具身智能所带来的机遇,Nakul提出,具身智能意味着将智能深度嵌入物理世界,推动行业朝着在机器人中实现通用智能的目标迈进。他强调,生成式AI的出现是关键驱动力,使系统得以摆脱传统基于规则的束缚。尽管将具身智能应用于真实的非结构化环境仍面临高精度操作、人机协同等挑战,但AI算法的迭代速度正在加快。他借鉴Daniel Kahneman的“系统1”思维,指出未来需要构建统筹硬件(如四肢、执行器)的系统架构,并认为硬件对真实环境的接入能力是决定具身智能发展的基础。基于持续的数据采集、技能训练、针对性硬件设计,行业将迎来具身智能的新时代。

以下为演讲全文:

大家上午好!感谢各位的邀请。各位的发言非常精彩,很高兴能与在座各位同仁共聚一堂。

我们正看到,随着各行各业开始拥抱人工智能,整个工业生态系统正在经历一场巨大的变革。过去几年,当我们思考网络如何构建、产业如何发展以及解决方案如何部署时,主流路径是将智能迁移到云端,并在云端完成处理。然而,随着人工智能开始大规模部署,越来越多的行业正在重新思考:AI在日常工作中发挥的作用。正如多位同仁此前所提到的,边缘正变得越来越智能,模型能力也在不断提升,这使我们能够在多个平台上推动解决方案的落地。这一趋势几乎适用于所有垂直行业生态。

此外,我们开始看到AI在边缘侧部署的环境非常广泛。这些场景涵盖移动应用、固定场景应用,以及在许多情况下的无人化应用,当然还包括各种尺寸的终端。

当我们从更宏观的角度思考这一变化究竟意味着什么、究竟发生了哪些改变时,可以看到一个根本性的转变:随着边缘侧变得越来越智能,它正在具备环境感知能力(situational awareness),并能够在边缘侧直接做出决策,而在过去这需要依赖云端来完成。过去五年间,模型变得越来越智能,并且越来越贴合其运行的数据环境。随着模型具备更强的模式识别能力,并能够在真实世界运行中不断学习和优化,智能体正在各类应用场景中变得越来越智能。

与此同时,我们也正在看到机器到机器(machine-to-machine, M2M)应用的重大转变。过去,这类应用更多是采集数据并发送到云端处理;而现在,它们正逐渐在实现独立智能运行。除了机器之间的交互之外,随着大语言模型(LLM)的发展,当人被纳入系统闭环后,机器与人之间进行沟通和交互也变得非常直接和简单。而这一整轮转型,正在我们所处的每一个产业生态系统中展开。

在过去几年中,高通一直在一个重要领域表现突出,那就是将XR技术引入工业应用、消费应用以及商业应用生态之中。如今,人们已经可以在智能眼镜等设备上运行小型模型。例如,当你看到某个事物时,可以让眼镜拍下一张照片,并直接向设备提出问题。随后,这个查询请求可以被发送到你的手机,或同一系统中的本地设备,无需通过云端进行处理,然后再将答案返回给你。这种能力在过去是无法实现的。在与客户的交流中我们发现,这类技术进步正在彻底改变一线工作人员的工作方式,同时也在改变智能能力在边缘侧部署和应用的方式。

要让这一切真正发生,实际上需要使用全新的工具。你需要能够以新的方式处理数据——无论是结构化数据、半结构化数据,还是各种形式的非结构化数据,都必须具备处理能力。同时,还需要能够处理真实世界数据,在许多情况下还包括合成数据,并在不同场景中对数据进行很好地融合与整合。通过这些数据对模型进行训练,并进一步微调,最终将这些模型部署到实际应用中。

随着这一工具在越来越多的应用场景中运行,其能力正变得越来越强大,发展势头也在不断增强。通过这种方式,我们就有可能将人工智能真正推进到边缘侧。除了持续推出各类产品之外,我们采取的一个重要策略,是专注于构建生态系统。在过去六个月中,高通完成的一项重要收购就是Arduino。

我们意识到,当开始思考AI和边缘计算时,未来可能出现的应用场景几乎是无限的。实际上,很难提前预测或判断未来究竟会出现哪些具体应用。因此,我们采取的方法是:确保能够将技术交到数百万开发者手中。这一策略可以覆盖教育领域、商业领域以及消费领域。从硬件开发平台到开发工具链,我们为开发者提供完整的能力,使他们能够在边缘侧构建应用。

通过这样的方式,我们正在把这一整套能力整合起来,使开发者生态能够获得数据访问能力——无论是示例应用(sample apps),还是连接他们自己的数据库。同时,开发者还可以编程模型、在边缘硬件平台上部署模型,并且这一平台具有较低成本。这些模型随后可以通过反馈闭环不断训练与优化,并最终在广泛的工业生态系统中部署应用。正是通过这种方式,我们能够推动非常复杂的应用真正落地。

在这个例子中,我们可以看:计算机视觉正逐步演进到视觉语言模型,并进一步迈向视觉-语言-行动模型(VLA模型)。这一演进让我们能够以一种全新的架构方式来思考系统设计——例如摄像头与连接能力如何协同工作,从而对摄像头所看到的场景进行完整的态势感知与分析,并将这些信息实时提供给整个生态系统使用。

目前,我们正在多个应用场景中推进这类能力的发展。例如:部署在边缘侧的固定摄像头、安装在工业网关上的摄像头,以及安装在无人机上的摄像头。这些设备可以通过各种无线网络进行连接,无论是专用无线网络、公共无线网络,还是其他类型的专有或开放网络,都可以支持相关应用的运行,应用既可以结合云端能力,也可以使用本地部署的计算设备。因此,各种不同的部署模式都是可行的。而令人惊讶的是,这些能力真正变得现实,其实只是在过去大约24个月甚至更短的时间内发生的,发展速度非常快。

对我们来说,一个重要的认识是:客户正在采用的网络架构将会发生变化。正如大家刚才提到的,要让智能能力真正下沉到边缘侧,整个生态系统还需要完成大量的能力建设与协同。

我们正处在一个非常令人振奋的时代。我相信大家都会同意,“具身智能”(Embodied AI)是一个相对新的概念。我们过去并未充分认识到智能正被嵌入进物理世界,而如今,让物理实体具备智能、能够学习,并在学习过程中持续改进,已经成为一个全新的方向。我们正在朝着在机器人中实现通用智能的道路迈进。

从根本上看,生成式AI的出现带来了重要变化。它使我们能够摆脱传统基于规则的系统,转而构建能够适用于各种环境的智能系统——无论是在云端、边缘侧,还是在机器人之中——都能具备持续学习的能力。

当把这一能力应用到机器人领域时,一个非常有意思、但同时也充满挑战的问题是:机器人需要面对的环境往往并不是结构化环境。机器人并不是运行在虚拟世界中,而是运行在真实的物理世界里。因此,在很多方面仍然有大量工作需要完成,例如:如何定义机器人所处的物理环境,以及如何对机器人进行训练——尤其是在需要高精度操作、高速度响应,以及与人协同工作的场景下。

目前,我们仍处在这一转型的早期阶段。但人工智能发展的速度,以及AI算法在特定任务上不断提升精度和能力的速度,已经开始明显加快。

从高通公司的角度来看,这段发展历程其实非常有意思。我在高通负责多个业务领域,其中我们已经在ADAS驾驶辅助领域深耕多年。我们逐渐认识到,从根本上来说,驾驶辅助就是将人或货物从 A 点运输到 B 点。某种意义上,它其实是一种运输机器人。这种系统并不需要具备很高的灵活性,它主要需要做的是在遵循既定规则的前提下避开障碍物并完成路径行驶。因此,从驾驶辅助的定义来看,可以说基于规则的驾驶辅助其实已经存在了很长时间。而随着基于 Transformer 的人工智能技术开始应用,如果将这些能力引入其中,这一领域的发展正在开始加速。

但如果把这些能力进一步应用到真正的物理机器人上,就会出现许多不同之处。机器人需要面对的是精度、操作范围以及执行等问题。在这种情况下,目标不再只是从 A 点移动到 B 点,而是要真正对物体进行物理操作,并完成具体任务。

正是在这一背景下,我们发现架构层面正在发生新的变化。模型将越来越依赖于视觉、语言和行动的结合,而在此基础之上,我们还将进一步提升系统能力,使其具备物理智能。

所有这些发展也带来了一个新的问题:我们是否可以在不考虑物理硬件形态的情况下,直接为具身对象部署人工智能?我们认为,具身智能系统中的物理硬件,其实类似于大脑和神经系统。这套“神经系统”在过去并没有被我们真正视为人工智能生态系统中的一部分。因此,我们正在投入大量时间思考:未来应该构建怎样的系统架构,去统筹身体各个部分,例如四肢、双手以及各种执行启等。

在这一过程中,我们看到 Daniel Kahneman 提出的系统1(System 1) 思维——也就是说,需要思考哪些能力属于类似“系统1”的能力。这些能力帮助我们更好地理解,未来系统中哪些基础能力和核心组件需要被构建。

从根本上来说,我们认为硬件本身以及不同类型的硬件,再加上硬件对数据的基础获取能力以及对机器人实际运行环境的接入能力——也就是机器人真正存在并执行任务的环境——都将成为关键基础。这些因素将决定我们如何采集任务相关的数据、训练机器人,并将任务训练逐步转化为我们所构建的技能能力。随着时间推移,通过持续的数据采集和技能训练,并结合针对具体任务设计的硬件,我们将能够推动具身智能迈向新的阶段。

我们确实生活在一个非常令人兴奋的时代。很高兴今天能在这里与大家交流,非常感谢大家的时间。

来源:https://www.163.com/dy/article/KN8U55MK05118HA4.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

BCBC币(BCBC)实时行情?
web3.0
BCBC币(BCBC)实时行情?

BCBC币(BCBC)深度解析:技术底色与市场前景 在百花齐放的数字货币领域,总有项目希望以独特的技术路径站稳脚跟。BCBC币(BCBC)正是其中之一,它依托一套组合技术方案来构建其安全与稳定的基石,目标直指高效、低成本的支付新体验,同时也不失为投资者眼中一个潜在的增值选项。 技术架构:不止于共识的

热心网友
04.02
BNB连锁店在最新焚化活动中燃烧了价值9.16亿美元的代币
web3.0
BNB连锁店在最新焚化活动中燃烧了价值9.16亿美元的代币

BNB Chain完成第31次季度销毁,近10亿美元BNB永久退出流通 近日,全球顶尖的区块链基础设施BNB Chain正式完成了其第31次季度代币销毁。根据官方公布的数据,本次共计销毁了1,579,207 716枚BNB,按销毁时市场价值计算,总额高达约9 16亿美元。此次大规模销毁再次向市场展现

热心网友
04.02
openclaw 常见命令解析
AI
openclaw 常见命令解析

OpenClaw 核心命令完全指南:从入门到精通 当您开始接触一个新工具时,最常见的障碍是什么?往往是面对复杂的命令列表感到困惑,只能被动地复制粘贴。这不仅影响效率,而且在遇到问题时更难以排查。 本文将为您深入解析 OpenClaw 的关键指令,帮助您从基础操作者转变为理解原理的熟练用户,全面提升配

热心网友
04.02
全球首款带物理直觉的AI模型在沪发布,理解真实世界规律
科技数码
全球首款带物理直觉的AI模型在沪发布,理解真实世界规律

让AI告别“重视觉效果、轻物理逻辑”的行业短板,近期五一视界(51WORLD)发布全球首款物理直觉世界模型51World Model,实现AI遵循物理规律推演、与真实场景全要素交互的核心突破,彻底破

热心网友
04.01
宇树G1机器人拆解:揭秘超40%毛利率与全供应链控制
科技数码
宇树G1机器人拆解:揭秘超40%毛利率与全供应链控制

一台售价8 5万元的人形机器人,拆开来看,成本只有4 16万元,预估毛利率40 7%。但宇树G1的真正壁垒,藏在硬件之外。3月30日,中邮证券电新团队分析师苏千叶、盛炜、杨帅波发布《宇树G1人形机器

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02