王兴兴谈机器人瓶颈：AI模型与大模型的不足

时间：2026-06-23 14:32

宇树科技王兴兴指出机器人最大短板是AI大模型在多模态融合上远未达标，硬件反而够用。大模型虽在语言、图像领域出色，但缺乏对真实世界的理解与高难度任务处理能力，单纯堆参数无效，需优化算法并加强软硬融合。

近年来，人工智能与机器人无疑是科技领域最受瞩目的焦点，AI驱动更已成为行业共识。然而，最近宇树科技创始人王兴兴提出了一个颇为反直觉的观点：当前机器人的最大短板，恰恰在于AI大模型本身尚不足以支撑其发展。此言一出，不少人感到意外——大模型不是正发展得如火如荼吗？怎么反而成了瓶颈？

一、王兴兴：机器人的核心问题仍然出在AI模型？

在2025外滩大会的圆桌讨论中，王兴兴直言不讳：机器人的硬件与大脑存在严重脱节。硬件方面，他认为“用一两年都够用”，真正制约发展的，是AI大模型在多模态融合上的表现远未达标。纯语言模型或纯视频模型目前确实表现出色，但要把语言与图像有效融合，难度依旧不小。更令人担忧的是，目前还没有有效的方法将硬件真正利用起来——例如如何通过模型控制机器人的灵巧手，这类问题至今仍是挑战。

他打了个比方：AI在信息处理、文字与图像领域已是百花齐放，但到了让AI具体执行任务的领域，还是一片荒芜，只有寥寥几株小草。“爆发性增长的前夜尚未到来。”不过，王兴兴也给年轻人吃了一颗定心丸——他认为这个时代对年轻人十分友好，AI时代公平公正，大家完全可以借助模型自学编程。他甚至鼓励大家将AI视为一个全能型伙伴，而不仅仅是工具，要用更具前瞻性的认知去拥抱它。

实际上，持有类似观点的人不在少数。网上流传着一则段子，尤其能说明问题：“我理想中的AI，是帮我洗衣洗碗，好让我去玩艺术、搞创作；可现实中的AI，却跑去玩艺术搞创作，让我来洗衣洗碗。”这一句调侃，道出了许多人的困惑。

二、大模型到底“不够用”在哪里？

王兴兴的表态之所以能引发广泛共鸣，背后折射出整个行业正在面临的深层困境。大模型近年来发展迅猛，但在机器人领域，它的“不够用”具体体现在哪些方面？我们逐一剖析。

首先，大模型看似热闹，实则大多停留在逻辑推理的初级阶段。当前模型参数动辄千亿、万亿，但它们的“智能”更多建立在对海量数据的统计与模式匹配上。写文章、回答问题、翻译文本，这些任务都表现出色。然而，一旦涉及隐晦的隐喻、双关语，或需要文化背景才能理解的表达，模型往往会露出破绽。更关键的是，每次训练都需要海量数据与天价算力，成本高、周期长，不确定性也大。因此，尽管大模型风头正劲，离真正的成熟仍有不小距离。

其次，硬件进步迅速，但大模型的思维方式与人类相去甚远。如今的机器人传感器、执行器、机械结构都已相当成熟——工业机器人能完成复杂装配，服务机器人能自主导航避障。但问题在于，硬件的提升并不能自动带来智能的飞跃。人类处理事情依靠直觉、经验与创造力，许多事对我们来说是“本能”——比如一眼看出物体的用途，或瞬间理解场景的氛围。而大模型要完成相同任务，需要大量标注数据反复训练，本质仍基于统计规律，缺乏对事物内在机理的理解。这种思维方式的差异，导致大模型在面对真实世界的复杂场景时常常力不从心。

第三，大模型目前仅能替代基础工作，遇到高难度任务便暴露短板。从实际应用来看，客服问答、格式化文稿生成、预设程序的装配检测——这些规则明确、步骤重复的工作，大模型确实能够胜任。但一旦任务复杂度提升，比如需要多步骤推理、跨领域知识整合，或动态适应环境变化，大模型的表现就会迅速下降。举一个简单例子：让家庭服务机器人完成“播放音乐”“开灯”这类指令很容易，但如果说“帮我找找昨天收到的快递，可能放在门口鞋柜或者沙发底下”——机器人就需要同时理解时间、物品、空间位置，还要具备视觉搜索、物体识别、路径规划和交互反馈能力。对当前大模型而言，难度堪比登天。

第四，具身智能要真正构建一个能干活的大脑，道路还很漫长。具身智能的目标是让机器人像人一样在真实世界中自主完成各种任务。目前市场上已有大量工具化机器人——扫地、搬运、焊接，都很实用。但要实现像人类那样的“多面手”，困难依然巨大。以做家务为例：一个合格的家庭主妇不仅要会打扫、洗衣、做饭，还得懂得家人的习惯与喜好，遇到突发情况能灵活应对。这就要求机器人的大模型具备全面的生活常识、情感理解与社交沟通能力。目前，有些机器人甚至学会了扭秧歌这样的表演性动作，但这距离成为真正的家庭得力助手，中间还差着好几个数量级的训练与实践积累。

第五，未来到底该怎么走？简单粗暴地堆参数已经没有意义。一味扩大模型参数规模，带来的不仅是训练成本飙升、推理速度下降，还有可解释性越来越差。真正该做的，是把大模型的进化方向对准具身智能的实际落地。一方面，优化训练算法，用更少的数据与算力获得更优性能；另一方面，加强软硬件的深度融合，让机器人的传感器数据实时反馈给大模型，帮助它更准确地感知环境、理解任务，从而做出更可靠的决策。

至此，王兴兴提出的问题答案已经清晰：大模型的“不够用”，并非数量不足，而是智能深度与实用性尚需质的飞跃。这才是大模型下一步真正应该攻克的方向。

来源：https://www.aiagiai.com/14703.html

上一篇昔日王者TensorFlow已死深度学习框架时代宣告终结 下一篇GPT-5零分惨败，顶级AI全军覆没，奥特曼博士级神话破灭

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-02

内网RPA离线部署从依赖打包到7×24无人值守踩坑与避坑方案

这三年，内网RPA项目接了不下二十个。每次开局都像闯关——断网、缺依赖、多机同步、定时执行、批量分发、源码保护、AI离线化，八个坑一个比一个深。今天把这些实战经验整理出来，希望能帮正在内网搞自动化的兄弟们少踩点雷。一、内网无网络环境怎么部署RPA流程：先搞清楚什么叫“真离线” 很多工具宣传“支持本

AI教程 · 2026-07-02

水利工程师用WorkBuddy写洪水报告效率提升3倍

WorkBuddy开发者分享季水利工程师AI提效实战：用WorkBuddy撰写洪水影响评价报告，效率提升3倍 WorkBuddy 效率人工智能开发工具一、我是谁，为什么需要AI 先介绍一下自己——我是一名水利工程师，在湖南长沙的一家小型水利设计公司任职。当前行业环境不太

AI教程 · 2026-07-02

日志服务数据加工规则洞察仪表盘使用指南

数据加工诊断仪表盘想实时掌握日志服务加工功能的运行状态？直接从加工列表页点击那个“规则洞察”按钮，仪表盘就会立刻呈现出来。入口就在那儿，不绕弯子。跳转后，你可以按作业名称、实例ID或源LogStore来筛选任务状态。比如下边这张图，展示的是当前实例ID（90c9d47714dbb807d47c1

AI教程 · 2026-07-02

基于RFID的固定资产管理系统技术架构与工程实践

固定资产管理难题是众多企事业单位的普遍困扰，资产数量动辄数千件，且广泛分布于不同部门、楼层乃至园区。传统人工盘点方式在工程维度上始终面临三大关键瓶颈：采集效率低下、数据闭环中断、状态同步滞后。使用条码枪逐一扫描标签，识别距离通常不超过30厘米，操作人员需逐个寻找并扫描，盘点效率完全受限于人力。面对5

AI教程 · 2026-07-02

WorkBuddy实战用AI搭建A股智能盯盘助手省心高效

炒股的朋友们想必都深有体会——每天重复盯盘、查行情、分析板块轮动，这一整套流程下来耗费大量精力。手动翻查数据不仅身心俱疲，还很容易错过关键买卖节点。今天我们就来聊聊如何打造一款趁手的盯盘工具，借助AI替你分担这些重复性工作。背景：盯盘的核心痛点股民都有同感——每天不只要查询单只股票的实时行情，还