2024年,具身智能创业浪潮显得尤为激烈,但需保持清醒。智能涌现通过与数十家机器人企业交流,发现了一条隐形的行业“鄙视链”。
软件开发者往往轻视硬件开发者;大模型团队看不起强化学习团队。多位业内人士给出了几乎一致的判断。这背后核心是思路的分化——认知差异决定了入局策略的截然不同。
英诺天使基金合伙人王晟提供了一个更清晰的分类方法:当前国内涌现的几百家机器人初创企业,大致可分为三类基因。
第一类是本体派,核心团队原本来自机器人领域,更侧重硬件能力,重点关注控制、电机、关节等环节。核心是机器人本体(人形或四足机器狗),其次为机械臂或关节。
第二类是软件派,更注重机器人的智能化与泛化能力。软件派可进一步细分——一部分是过往AI浪潮的从业者(从事CV、强化学习等),另一部分是具备大模型背景的新玩家。后者人数虽少,但常占据鄙视链顶端。
一家具身智能大脑公司的创始人直言:“看不上国内那些搞硬件的公司。”在他看来,软件才是机器人的真正瓶颈,而硬件公司对AI软件的投入严重不足,“只是简单接入国外开源的大模型”。
宇树科技算是典型的硬件派。创始人王兴兴在公开采访中回应称:他们对于AI的投入较为克制,因为成本过高,“机器人才是我们的立身之本”。他甚至表示,“欢迎客户用我们的硬件,即便把我们的软件全删了”。
一家机器人硬件公司人员无奈表示,目前机器人在“软”的方面尚未形成共识——行业存在众多技术范式和路线,大脑和小脑的边界如何定义?具身智能的实现路径?目前仍显混乱,留有大量疑问。

宇树Unitree G1
“软硬之争”的结果是,多数硬件公司仍沿用传统硬件思维制造机器人,对“脑”的运用流于表面;多数做“脑”的公司,则选择从零开始自建硬件。各自为政,行业呈现出一种隐约的割裂状态。
大模型,尚未能真正“赋能”机器人
“当前做硬件的公司,简直就是视频拍摄公司!”多位投资人和行业人士给出了这样的评价。
今年以来的机器人Demo场景确实炫酷:在汽车工厂搬运物料、在货架前分拣商品,给人AGI时代机器人已照进现实的错觉。
但实际情况呢?远没有看上去那么美。
一个看似完美的Demo背后,往往隐藏着这样的过程:训练时从抽屉中抓取水杯,但拍摄时已是黄昏;或者训练时抽屉内多了两个杯子、抽屉位置发生了偏移——这些微小的变化,都可能导致任务失败率急剧上升。
“有的Demo,甚至成功概率只有万分之一,存在严重的不诚实现象。”一位行业人士说。
你可能困惑:大模型在手机、电脑等终端上已足够智能,但为何在机器人领域表现不佳?以至于硬件公司需要在Demo上如此“下功夫”。

figure 02
据智能涌现了解,大多数硬件公司对大模型的理解和应用并不深入——基本仅是简单接入国内外通用语言大模型。但语言大模型与机器人真正所需的“空间智能”,差距甚远。
多位业内人士提到,语言大模型数据规模越大,越容易产生“幻觉”,从而干扰任务执行。他们给出了一致反馈:“语言大模型与机器人落地关联不大,在具体区域任务上,成功率惨不忍睹!”
前述具身智能大脑公司创始人表示,目前国内没有一个团队真正基于机器人需求,去适配具身智能的大模型。
此前,行业常用方案是:在多模态大模型与机器人身体之间,引入一个中间层“小脑”——其作用是承上启下,存储多项“子任务”(例如将“让机器人冲咖啡”任务拆解为“拿杯子-磨豆子-冲水”等多个子任务),供大脑调配,并使机器人身体能够理解并执行。
但新的挑战也随之而来。小脑的引入,意味着机器人厂商需要预设无穷无尽的子任务,面对复杂任务,各子任务还需进一步拆分。
更大的难题是数据匮乏。政府和企业投入了大量资源进行集中训练,但效果未达预期。大家既不清楚应收集何种数据,也无法界定优质数据的标准。
以抓取杯子为例,理想状态下的高质量数据是——使用机械臂控制其从头到尾完成动作,指导它如何抓握杯子,当任一场景发生变化时,如何调整抓取方式。但一个简单的抓取动作,就需要几千万甚至几亿条数据。
当许多人带着“大模型改变一切”的期望进入机器人领域时,才意识到中间的差距远超过想象。
一场集体纠偏
从行业角度来看,这种割裂状态并不健康。目前,投资人和产业玩家们正在经历一场“纠偏”。
2024年下半年,机器人行业投资风向悄然改变。王晟告诉智能涌现,2024年之前,许多投资人简单认为:投机器人等同于投资人形机器人硬件。
过去一年半,人形机器人企业异常火热,估值飙升。以宇树科技、智元机器人为例,这两家备受关注的机器人硬件厂商,在近两年连续完成多轮融资后,估值均已突破10亿美金大关——“贵到投资者望而却步”。

智元远征A2-max
与此同时,许多专注机器人小脑或大脑的公司面临融资困难,一些公司甚至需要重新思考市场故事。
“今年下半年以前,我们向投资人讲,做机器人统一大模型、讲端到端,谁信呢?”前述机器人大脑公司创始人表示——“但今天你不讲端到端,都不好意思出门了。”
投资风向直至2024年下半年,出现了逆转。
一家做人形机器人关节的公司创始人坦言,今年已明显感觉纯做硬件的初创企业很难获得大额融资,“市场有点冷”。
从近期消息面来看——在海外,Skild AI、Physical Intelligence在成立短短时间内,估值迅速飙升至百亿级别;在国内,机器人小脑公司“星海图”获得蚂蚁集团投资,大脑公司“自变量”、“千诀科技”也陆续获得融资。
“现在投资人从投人形,改为投具身智能了。”王晟表示。因为大家逐渐认识到,具身智能才是机器人实现泛化任务的关键。
反思不止在投资层面。一波硬件厂商也开始集体复盘过去的模式:过去,机器人厂商主要在专用领域收集数据,再用于专用场景,大家信奉“通用,就是没用”。
如今,尽管大模型尚未真正投入使用,但它给这一派创业者带来的启示是:或许应该先学会忘记专项场景,先构建通用的基础模型能力,再在此基础上生长出专用能力——这或许是系统化解决通用性的关键。
机器人圈中的软硬之争,归根结底,需要全链条的打通。AI时代来临,行业共识尚未完全形成,但肯定的是——机器人的终局是硬件与具身智能的融合,软硬件缺一不可。
“无论是从软件出发还是从硬件出发,大家的终局是接近的,就看谁的商业效率更高。”一位行业人士表示,“而AGI时代的机器人公司,本质上需要既懂AI、又懂硬件的团队。但更关键的是,大家还要相互认同”。
