让不跳舞的人形机器人完成“干活”新挑战
人形机器人把新战场锚定在了春晚亮相。热闹之余,“我们不需要100万台跳舞机器人”的声音,也开始在互联网上扩散。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
麻 将人形机器人把新战场锚定在了春晚亮相。宇树科技、魔法原子、银河通用、松延动力等具身智能企业,近期纷纷宣布即将登上春晚的消息。热闹之余,“我们不需要100万台跳舞机器人”的声音,也开始在互联网上扩散。
事实上,在以跳舞等展示性能力维持高曝光度的同时,各家具身智能企业也在加紧推进人形机器人进入真实场景干活,而在经过一段时间的发展后,各家企业也都在各自的路径上取得了阶段性成果。
开年官宣完成10亿元融资的自变量机器人,在近期就发布了机器人基于公司自研VLA端到端模型,实现全程自主配送外卖的实拍视频。
自变量机器人是最早一批押注端到端具身大模型技术路线的公司,这一技术路线的核心在于,通过统一的具身大模型,让机器人在真实环境中完成从感知、推理到动作执行的连续决策。沿着这种技术路径发展,人形机器人将走向通用劳动力的终极方向。
不过有业内人士对《科创板日报》记者表示,端到端具身大模型并非一条轻量化或高确定性的技术路线。
一方面,模型训练高度依赖真实世界交互数据,验证过程因此难以规模化复制;此外,统一模型在提升系统整体性的同时,也放大了工程调试与异常定位的复杂度。尤其是在真实场景中,机器人往往需要完成跨环境、长任务链的连续操作,对模型稳定性与容错能力提出了极高要求。“这也意味着选择了这一路线的公司,往往需要更大的资金和资源投入,也意味着更长周期的商业兑现。”
同样展示了机器人在配送场景能力的还有速腾聚创。在这一长达100分钟的视频中,机器人在无人工干预条件下,连续完成拆包、折叠回收箱、物品搬运、跨场景导航、电梯交互等一系列近20个步骤操作任务,重点验证的是长时间运行下的稳定性与动作一致性。
不过,相似的技能点下,是一套不同的技术逻辑。速腾聚创相关技术人员向《科创板日报》记者介绍,公司的具身智能方案并非传统VLA,而是在此基础上扩展为VTLA-3D,“通过在视觉之外引入激光雷达3D点云以及灵巧手触觉等信息,提高模型对空间结构与物理约束的理解。”
在其看来,更高密度的感知输入,有助于在训练阶段减少对大规模数据的依赖。“模型达到当前展示能力水平所需的有效训练数据量约为200小时量级,训练收敛速度相对更快。”
其进一步指出,这一路径与速腾聚创在智能驾驶领域的长期积累密切相关。“在自动驾驶实践中已发现,融合激光雷达3D点云与视觉信息的模型,相比纯视觉路线,在达到同等性能目标时,所需数据量可减少一个数量级。”
业内人士表示,这事实上也代表了当前具身智能落地应用的两种路径,即:一类通过引入激光雷达、触觉等多模态感知,提高信息密度,以降低训练数据规模,优先解决真实环境中的稳定执行问题;另一类则坚持纯视觉路线,依赖规模化数据与模型能力,试图在更长期维度上逼近跨场景的通用智能。
“可以简单总结为,多模态路线强调当下可用性,纯视觉路线押注长期通用性,二者解决的是不同阶段的问题。”
与上述两类以模型能力为核心的路径不同,当前还有一条更偏工程与交付导向的路线正在推进。这一路线并不试图在早期阶段解决通用智能问题,而是通过规则拆解、模块化能力组合与强控制体系,让机器人在相对明确的任务边界内稳定完成工作。 这类企业通常在本体领域有较强的技术积淀。
在这一技术逻辑下,机器人“干活”的前提是任务被充分结构化:需要完成哪些动作、在什么环境中运行、如何处理异常情况,均在系统设计阶段被明确拆分,并通过工程手段逐一兜底。其优势在于可控性强、系统稳定,能够在工业、巡检等半结构化场景中较快实现落地,也是当前出货与交付确定性相对较高的一类路径。
但相应的瓶颈也较为清晰。由于能力更多依赖规则与工程配置,这一路线对场景变化的适应能力有限,一旦环境或任务发生显著变化,往往需要重新进行系统调试与适配,扩展成本随场景数量线性上升。
从更宏观的产业视角看,不同具身智能企业在路径上的分化,本质上是在尝试以不同方式跨越人形机器人规模化应用的几道现实门槛。多名行业人士在采访中普遍认同,人形机器人从演示走向大规模部署,至少需要同时解决安全共存、持续运行、灵巧操作以及成本控制等问题。
在这些约束尚未被系统性突破之前,各类技术路线更多是在不同门槛前的分段推进:有的优先押注通用智能,有的率先解决工程可用性,也有的通过任务拆解实现稳定交付。这也决定了,短期内人形机器人更可能以能力边界清晰、应用场景明确的方式进入真实生产与服务体系,而非一步到位成为通用劳动力。
多路径并行推进的大背景下,行业对“何时出现真正质变”的预期也逐渐趋于理性。
上海市人大代表潘晶在近日接受财联社等媒体采访时就表示,中国在机器人产业链完整度、制造基础和应用场景丰富度等方面具备得天独厚的优势,但具备真正泛化能力的人形机器人突破仍需要时间积累。他判断,未来五年内,相关核心能力有望出现阶段性突破。
热门专题
热门推荐
百度网盘个人版如何转企业版?完整切换步骤详细指南 当个人网盘难以满足团队文件共享与协作需求时,百度网盘提供的企业版无疑是高效解决方案。本文将为你详细解析如何直接在百度网盘App内,将个人账户一键切换至功能更强大的企业版,快速开启团队文件管理新模式。 第一步:进入个人中心页面 首先,请确保已安装并打开
“AI+eSIM”云智终端方案正式商用,首批合作项目5G AI CPE成功落地 在MWC 2026世界移动通信大会上,产业合作迎来重大进展。由全球移动通信系统协会(GSMA)与中国联通共同倡导的“‘AI+eSIM’云智终端合作联通方案”正式对外发布,并迅速完成首个商业化项目签约。中国联通联合通则康威
洛克王国世界水泡壳技能搭配完全指南:打造攻防一体的战术核心 世界水泡壳的技能池设计充满了战术深度,完美诠释了攻防一体的战斗哲学。无论是纯粹依靠威力压制对手的技能,还是具备控制、辅助等战略功能的技能,都能在其技能库中找到。掌握其技能搭配的核心思路,是让世界水泡壳在对战中发挥出全部潜力的关键,能够轻松取
现货比特币ETF单周吸金14 2亿美元,强势回归背后的市场信号 加密货币市场正迎来关键转折点。近期数据显示,现货比特币ETF资金流入呈现爆发式增长,成为近期最受关注的市场风向标。这不仅反映了机构资金的重新布局,更可能预示着市场供需结构的深层变化。 数据解读:创纪录的资金流入意味着什么? 根据专业追踪
河西竹篮打水奇遇触发地点指南 想要成功触发《燕云十六声》中颇具趣味的“竹篮打水”奇遇,玩家需要首先前往河西地图的特定区域进行探索。该触发点位置较为隐蔽,建议在河西沿岸的村落与水边场景多番巡视。当你接近正确位置时,可以留意游戏内的环境暗示,例如独特的视觉标识、背景音效的变化或氛围的微妙转变,这些都是系





