首页 游戏 软件 资讯 排行榜 专题
首页
AI
英伟达Jim Fan年度复盘:Vibe Coding大火,机器人领域如何破局?

英伟达Jim Fan年度复盘:Vibe Coding大火,机器人领域如何破局?

热心网友
30
转载
2025-12-29

英伟达机器人业务负责人、GEAR实验室联合负责人Jim Fan近期分享了他对当前机器人领域发展的冷静观察。他指出,目前整个机器人行业仍处于相对混乱的阶段,甚至连技术发展的主流方向都尚未明确,存在走偏的可能性。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

知名科技评论人AK近日也在社交媒体上发布推文,其观点引发了行业媒体的广泛讨论。AK认为,像Vibe Coding这类技术的发展速度令人震惊,其进步之快甚至让他本人也感到焦虑。他进一步表示,如果过去一个月没有紧跟技术发展节奏,那么对软件行业的认知可能已经过时了。

展望2025年,机器人领域的发展图景或许会更趋复杂。英伟达机器人业务负责人、GEAR实验室联合负责人Jim Fan再次表达了他的审慎态度。他强调,机器人领域目前仍处于混沌状态,即便是那些看似明确的发展路径,也未必就是正确的方向。

Jim Fan最近分享了他对机器人领域现状的深度思考,这是他基于2025年的行业观察总结出的三点核心教训。

1. 硬件虽领先于软件,但可靠性问题严重拖累迭代速度

我们已经见证了诸如Optimus, e-Atlas, Figure, Neo, G1等机器人所展现出的精湛工程技艺。

然而现状是,机器人“身体”的物理能力已经超越了其“大脑”的指挥能力。我们虽然在应用最顶尖的AI技术,但并未能将这些前沿硬件的全部潜力充分释放出来。

更为现实的是,照料和维护这些机器人往往需要一整支专业的运营团队。

机器人不像人类,无法在磕碰损伤后自我愈合。过热、电机损坏、离奇的固件问题等故障每天都在困扰着我们。这些错误通常是不可逆的,也是不可原谅的。

Jim Fan不禁感叹:在此过程中,唯一能随着规模增长而同步增加的,恐怕只有研发人员的耐心了。

2. 评测基准(Benchmark)在机器人领域仍是一场灾难

在大型语言模型(LLM)领域,普通从业者通常认为MMLU和SWE-Bench等评测标准是常识。但到了机器人领域?先别急着下结论。

在这里,业界几乎没有对任何事项达成普遍共识:无论是硬件平台的选择、任务本身的定义、评分标准的确立、所使用的仿真器,还是现实世界测试环境的搭建。

每个人都倾向于为每一个新发布的成果临时定义一个基准测试,然后宣称自己达到了SOTA(当前最佳水平)。这就像是从一百次重复试验中,精心挑选出看起来最漂亮的那一次演示。

Jim Fan呼吁:到2026年,我们必须做得更好,停止将科学研究的可复现性和严谨纪律视为次要因素。

3. 基于视觉语言模型(VLM)的VLA路线“感觉不对”

VLA(视觉-语言-动作)模型长期以来一直是构建机器人“大脑”的主流方法。其配方看似简单:取一个预训练好的VLM(视觉语言模型)作为核心,再在上面嫁接一个动作输出模块。

但仔细想想,VLM主要是为应对“视觉问答”这类评测任务而高度优化的模型。

这便引出了两个关键问题:

1. VLM中的绝大多数参数是为服务于语言和知识理解而设,而非为物理世界交互服务的;2. 视觉编码器为了进行高层语义理解(如问答),会主动调整并丢弃大量底层图像细节。

然而对于需要灵巧操作的机器人来说,这些微小的视觉细节恰恰至关重要。

Jim Fan认为,没有理由相信VLA模型的性能会随着VLM参数规模的增加而线性扩展。这种基于VLM的预训练路线可能存在错位。

相比之下,视觉世界模型(Video World Model)似乎是更适合机器人的预训练目标。Jim Fan表示,他个人正将研究重心押注于此。

质疑与回应

针对Jim Fan的这些观点,网友Stewart Alsop提出了尖锐的质疑:

如果视频世界模型是更好的预训练目标,那么为什么像Helix、GR00T N1和π0这些已真正交付成果的模型,依然构建在VLM的骨架之上?

此外,世界模型的方法目前大多只用于策略评估和合成数据,而非直接的运动控制。

另外,既然硬件瓶颈限制了迭代速度,难道这不正说明在解决机器人数据匮乏问题之前,任何预训练路线都面临同样的限制吗?

Jim Fan回应道:

它们都是2025年的模型,我们期待2026年出现下一代更强大的模型。

我个人认为,2026年的行业风向标还要看谷歌。DeepMind显然还在酝酿大招,他们在8月份已经展示过强大的世界模型Genie 3,而Genie 4或许真能让机器人拥有在现实世界连续执行复杂任务的“大脑”。

来源:https://www.51cto.com/article/833020.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

线下机器人真机PK:这届黑客松玩法揭秘
AI
线下机器人真机PK:这届黑客松玩法揭秘

梦瑶 发自 凹非寺量子位 | 公众号 QbitAI机器人Demo大家都见过,但具身智能真机同台PK、当场对线,谁看了不得瞪大眼?(震惊 jpg)这场超燃的具身模型真机对决比赛,就发生在这两天在深圳举

热心网友
03.31
诺亦腾智能机器人战略合作,揭秘人机协同未来
科技数码
诺亦腾智能机器人战略合作,揭秘人机协同未来

北京商报讯(记者 陶凤 王天逸)3月31日,诺亦腾机器人(Noitom Robotics)宣布,与智象未来(HiDream ai)正式达成战略合作。双方将围绕具身智能训练数据的核心瓶颈问题展开深度合

热心网友
03.31
2026中国餐饮AI应用研究:智能化变革驱动行业新跃迁
科技数码
2026中国餐饮AI应用研究:智能化变革驱动行业新跃迁

文 | 红餐智库当前,中国餐饮行业步入存量竞争新阶段,人工、食材、租金等成本持续攀升,降本增效成为行业核心发展课题。人工智能技术的快速迭代与深度应用,为餐饮行业突破效率瓶颈、应对同质化竞争提供关键支

热心网友
03.31
黄仁勋站台的抱抱脸机器人卖爆了,背后公司竟来自中国
AI
黄仁勋站台的抱抱脸机器人卖爆了,背后公司竟来自中国

henry 发自 凹非寺量子位 | 公众号 QbitAI还记得Hugging Face去年推出的桌面机器人Reachy Mini吗?在刚发布的时候,量子位曾第一时间报道过这只身高28cm、体重1 5

热心网友
03.31
大连发布50个AI应用场景,赋能产业智能化升级
科技数码
大连发布50个AI应用场景,赋能产业智能化升级

近日,大连市工业和信息化局发布了大连市50个人工智能应用场景。记者注意到,这些场景包括多个行业的企业提交上来的场景需求15个、人工智能领域相关企业可提供的解决方案20个、大连市已落地的较好融合案例1

热心网友
03.31

最新APP

你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29

热门推荐

小米SU7智能座舱升级:更自然对话与流畅车外交互
网络安全
小米SU7智能座舱升级:更自然对话与流畅车外交互

IT之家 3 月 31 日消息,小米新一代 SU7 已于本月(3 月 19 日晚)正式上市,售价 21 99 万-30 39 万元。小米新一代 SU7 的超级小爱迎来了全新升级,小米智能助手最新微博

热心网友
03.31
AO3官网可用地址与在线入口说明
电脑教程
AO3官网可用地址与在线入口说明

AO3镜像 当前可用地址为https: archiveofourown org ,另提供https: ao3 cubeart club 、https: xiaozhan ic

热心网友
03.31
QQ邮箱SSL加密设置方法:3步开启安全传输
手机教程
QQ邮箱SSL加密设置方法:3步开启安全传输

在网络环境日益复杂的今天,保障邮箱信息安全至关重要。qq邮箱提供了ssl加密功能,能有效提升邮件传输的安全性,防止信息被窃取或篡改。下面就来详细介绍如何开启qq邮箱的ssl加密。登

热心网友
03.31
望月天角色千里强度实测与玩法指南
游戏攻略
望月天角色千里强度实测与玩法指南

在望月天月市这个充满奇幻与神秘的地方,角色千里犹如一颗独特的星辰,散发着别样的魅力。千里拥有着出众的外貌。他有着一头乌黑亮丽的短发,总是显得精神抖擞。深邃的眼眸犹如夜空中闪烁的星辰

热心网友
03.31
张凌赫、田曦薇等众星发文告别《逐玉》
《逐玉》收官:张凌赫、田曦薇与众主演深情告别
娱乐
张凌赫、田曦薇等众星发文告别《逐玉》 《逐玉》收官:张凌赫、田曦薇与众主演深情告别

播得轰轰烈烈的《逐玉》,终于是会员大结局了。之前网传的庆功宴,也是没机会举办。《逐玉》这部剧,也是从开播就伴随着争议。直到最后大结局播出,观众都能感受到剧情的前言不搭后语,拿个6 8分都是抬高它了。

热心网友
03.31