具身智能是什么从人工智能到具身智能的演进与边界
当机器人频繁亮相于各大卫视的跨年舞台,越来越多地闯入公众视野,人们便开始憧憬它们进入工厂流水线、走入家庭承担家务,甚至奔赴外太空建设人类第二家园的未来图景。不可否认,从需求侧来看,具身智能机器人所指向的,确实是一个潜力数万亿的宏大产业,一片令人向往的星辰大海。
然而,我们似乎较少从供给侧审视这个领域,去深入思考:人工智能技术的能力边界,是否真能囊括我们所憧憬的这片万亿蓝海?具身智能技术本身,又能否发展到足以让机器人变得足够“好用”,从而真正撬动社会生产效率曲线的地步?
在接下来的系列探讨中,我们将尝试从技术底层逻辑出发,探寻这些问题的答案。更确切地说,是勾勒出目前看来关于具身智能机器人未来较为合理的一个版本。论述中可能会涉及《AI3.0》(梅拉妮·米歇尔)、《数学之美》(吴军)等著作中的观点,以及陈建宇(星动纪元创始人)、Sergey Levine (Physical Intelligence) 等人士的公开分享。讨论的重点将集中于技术的内在逻辑与演进路径,而非深入每一个技术细节,也请理解对某些技术细节的阐述可能存在局限。
第一章:“智能”的起点——感知机与手写数字识别
一个有趣的物理现象是:站在高速行驶的火车车厢里向前发射一束光,与站在静止地面上发射同一束光,直觉上前者的光速似乎应该更快。但科学实验证实,两者的光速完全相同。光速是一个恒定常数,与光源的运动状态无关。
正是基于这一发现,爱因斯坦提出了狭义相对论,并严密推导出宇宙中任何具有静止质量的物体,其速度都无法超越真空光速这一上限。这堪称一次高屋建瓴的发现,揭示了宇宙的基本速度边界。
相对论的贡献远不止于此。这里想强调的是,很多时候,当我们怀着纯粹的好奇心去探索一件事物的边界时,这个过程往往会极大地深化我们对事物本身的理解,并得出关键的阶段性结论。
这也正是探索具身智能技术能力边界的出发点。同时,一项技术的边界之内是否蕴藏着足够广阔的产业未来,也是投资领域无法回避且需要持续修正的核心课题。
这段探索之旅,或许可以从“感知机”开始。
不妨思考一个具体问题:如何让机器识别人类手写数字?
以手写数字“6”为例。每个人的笔迹千差万别,即便是同一个人,每次写出的“6”也不可能完全一致。试图用编程规则明确告诉机器“什么样的图形是6,什么样的不是”,几乎是一项不可能完成的任务。
转机出现在20世纪50年代。美国计算机科学家弗兰克·罗森布拉特提出了感知机的概念与理论基础,并于1960年建造了名为Mark I的机器,它能够通过试错进行学习。这开创了机器学习的新范式。
那么,感知机是如何识别手写数字“6”的呢?

首先,将一张图片划分成足够多的网格,例如18x19共342个格子。划分的原则是让每个格子小到近似一个像素点。
接着,在黑白图像中定义像素强度:纯白格子为255,纯黑格子为0。从晶体管原理理解,可以用8位二进制数(范围0-255)来表示这256个灰度级,这与计算机的二进制系统是相通的。
于是,这个用于识别数字“6”的感知机便拥有了342个输入节点,每个节点对应一个格子的像素强度。系统会随机生成342个权重值,分别赋予每个输入,同时设定一个阈值。此时,感知机内部没有任何关于“什么是6”的明确规则,只有一套算法逻辑:将所有输入值乘以对应权重后求和,若总和大于阈值,则输出1(判定为“6”);否则输出0(判定为“非6”)。
由于初始权重和阈值都是随机设定的,这个感知机起初必然会大量识别错误。接下来便进入“监督学习”阶段:我们使用大量已标注的样本(即明确知道是否为“6”的图片)来训练它。简单理解,当识别正确时,系统不调整参数;识别错误时,则自动调整权重和阈值,直至正确为止。这个“自动调整”的核心算法,就是后来成为人工智能基石的“反向传播算法”。(关于反向传播的详细原理,我们将在下一章介绍,此处暂且接受这套成熟有效的算法框架。)
通过反向传播训练,一个有趣的现象发生了:权重值会逐渐向数字“6”的边缘特征区域集中。而在图片四个边角的纯白背景区域,对应的权重值在训练后会变得非常小,甚至趋近于零。原因在于,如果这些共有背景区域的权重值很大,那么任何一张手写数字图片(无论是不是“6”)输入时,因其背景像素强度高(255),乘以大权重后都会产生很大的乘积,导致总和轻易超过阈值,从而使感知机将任何数字都误判为“6”。
换句话说,一个能正确识别“6”的感知机,必须对“6”所独有的边缘特征区域异常敏感——这些区域细微的灰度变化,都会因为乘以较大的权重而产生显著影响。同时,它必须对那些所有数字共有的背景区域“视而不见”——无论这些区域多亮,其贡献都应被权重压制到近乎为零。
至此,感知机的基本逻辑和架构已然清晰。人工智能通过反向传播算法调整参数(权重)进行训练和学习的方式,由此奠定基础。
如今人工智能常被称为“黑箱”,其根源或许在于我们不太习惯这种不直接求解确切规则,而是让算法自行寻找最优参数的解决问题的方式。但严格来说,这并非完全不可知的黑箱,因为算法的每一步运作逻辑(输入、加权、求和、比较阈值、反向调整)都是清晰明确的。
计算机所做的,不过是不断比对自身输出与标准答案的差异,并通过反向传播持续优化其内部的权重参数,使得算法模型能够越来越逼近人类书写数字的习惯特征,以及人类心中那种难以言喻的、将某个图形认定为“6”的直觉标准。
值得一提的是,罗森布拉特不仅是一位计算机科学家,同时还兼具心理学家和神经科学家的背景。他提出感知机架构,正是受到了人类大脑神经元工作方式的启发。这是一次伟大的触类旁通。就像如今我们发现,扩大机器人的预训练数据规模和质量,能显著提升其在特定垂直任务上的性能上限一样,碳基生命与硅基智能之间,似乎存在着不少成长逻辑的相似性。这无疑让我们对人工智能乃至具身智能的能力边界,产生了更为浓厚的探索兴趣。
下一章,我们将尝试从数学角度解构“反向传播算法”。这将是探索技术边界更为深入的一步。
注:1.富荣福锦混合成立于2018年3月16日,于2021年4月19日增加存托凭证投资范围和投资策略,R4(中高风险)。基金经理任职期:胡长虹(2018.03.16-2018.11.26)、邓宇翔(2018.03.30-2024.06.24)、李天翔(2024.06.07-2025.02.19)、李延峥(2024.08.28-2025.11.18)、毛运宏(2025.05.29-至今)。
2.基金经理关注方向仅以当前市场情况判断,不必然代表当前或未来的投资方向。
风险提示:1、本材料中的信息均来源于我们认为可靠的已公开资料,但本公司及研究人员对这些信息的准确性和完整性不作任何保证,也不保证本材料所包含的信息或建议在本材料发出后不会发生任何变更,且本材料仅反映发布时的资料、观点和预测,可能在随后会作出调整。2、材料中的资料、观点和预测等仅供参考,在任何时候均不构成对任何人的个人推荐。市场有风险,投资需谨慎。3、基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,基金的过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩并不构成本基金业绩表现的保证。基金管理人不保证基金一定盈利,也不保证最低收益。基金管理人提醒投资人基金投资的“买者自负”原则,投资人在投资基金前应认真阅读《基金合同》、《招募说明书》和《产品资料概要》等基金法律文件,全面认识基金产品的风险收益特征,在了解产品情况及听取销售机构适当性意见的基础上,根据自身的风险承受能力、投资期限和投资目标,对基金投资作出独立决策,选择合适的基金产品。在做出投资决策后,基金运营状况与基金净值变化引致的投资风险,由投资人自行负担。我国基金运作时间较短,不能反映证券市场发展的所有阶段。4、文中提及行业仅为市场行情分析与逻辑解读,不代表基金管理人和基金目前或未来的投资方向。
相关攻略
红豆集团推出AI防摔服,专为老年人设计,融合服装科技与人工智能。产品采用高弹透气面料,内置智能气囊系统,通过双传感器与跌倒算法,可在0 05秒内识别风险并弹出气囊缓冲冲击。已获31项专利并完成真人演示,体现红豆“AI+服装+机器人应用”战略,以技术创新助力智慧养老。
交通运输部明确“十五五”期间将聚焦一体化、安全、数智、绿色四大方向,完善现代化综合交通运输体系。公路发展强调存量优化与数智赋能,水运注重统筹内河与海运网络。核心是加快建设智能综合立体交通网,深化人工智能规模化应用,攻克关键技术,以科技驱动行业全面转型升级。
最近,九号公司发布了两项引人注目的新技术——鼹鼠自平衡2 0和同频双闪。业内普遍认为,这不仅是九号作为行业科技创新“领头羊”的一次实力展示,更是其积极响应“人工智能+”国家战略,推动技术迭代与体验升级的生动实践。一个更清晰的信号是,电动两轮车行业正在加速蜕变,从过去聚焦外观、续航、动力的硬件竞赛,全
随着全球进入GW级算力时代,人工智能数据中心的能耗挑战愈发严峻。海兰云的海底数据中心凭借海水冷却与海上风电直连技术,实现了超过95%的绿电利用率,成为一项备受关注的技术创新。与此同时,在广阔的陆地上,另一种零碳解决方案也展现出巨大潜力——远景集团在内蒙古赤峰建设的零碳产业园区,探索出了一条独具特色的
泰尔股份5月22日涨1 49%,成交1 28亿元,主力资金小幅流入81 69万元。公司业务涵盖新型工业化、人工智能、机器人及锂电池等领域,均有实际业务支撑。当前股价接近8 33元压力位,面临方向选择。公司主营冶金装备及服务,一季度营收同比下滑但净亏损收窄,近期整体资金动向不明朗,筹码分散。
热门专题
热门推荐
以太坊基金会成立隐私研究集群,旨在推动私密支付与匿名投票等关键隐私技术的发展。该集群将整合研究资源,探索相关技术的最新趋势与潜在应用,为构建更安全、保护用户数据的去中心化生态系统提供支持。
MetaMask宣布将推出永续合约交易功能,允许用户进行双向开仓交易,覆盖多种加密资产。该功能伴随高波动性与爆仓风险,需谨慎操作。平台计划于十月底启动奖励计划,以吸引用户参与。投资者可通过主流交易平台注册并利用APP查看交易数据,同时需注重仓位管理、止盈止损及资金安全。
Meme币“币安汽车”市值近期大幅上涨,其背后与币圈知名人物贾跃亭的操盘策略密切相关。该现象揭示了当前加密货币市场中Meme币作为一种投机资产的波动性与关注度,反映了市场对特定人物影响力的高度敏感。
访问欧易官网需核对域名,防范钓鱼风险。建议通过官方渠道下载最新版APP。注册后需完成实名认证并绑定安全设备以提升安全。首次购币可通过C2C交易区进行,平台提供担保。此外,平台还提供合约交易、理财及行情分析等功能。新手应从官方渠道入手,逐步完成安全设置与交易。
币安交易所提供官网及移动应用两种访问方式,用户可通过官方渠道下载应用并完成注册,以使用其交易服务。平台支持多种数字资产交易,操作便捷,适合不同需求的投资者。





