特斯拉机器人训练量超汽车10倍,AI算力需求激增
北京时间8月26日,《商业内幕》披露,特斯拉将其在自动驾驶领域一贯倡导的纯视觉技术体系,全面引入到人形机器人Optimus的开发工作中。
据知情人士透露,特斯拉在6月底向内部员工明确表示,公司将全面转向采用纯视觉方案进行Optimus人形机器人的训练。
此前,特斯拉主要依靠穿戴式动作捕捉设备与VR头显来采集人类操作数据,并对机器人实施远程控制。如今,训练方式已转变为通过录制员工实际操作视频,让机器人从中学习拾取物品或折叠衣物等动作。
内部消息指出,特斯拉认为取消动作捕捉装置与远程操控,将有助于团队更高效地实现数据采集规模化。
这一战略调整标志着特斯拉在机器人研发方向上做出重大革新,也使Optimus的训练路径与埃隆·马斯克始终坚信的理念相契合:仅凭摄像头,人工智能便可掌握复杂的操作技能。这一理念正是特斯拉多年来训练自动驾驶系统所沿用的方法。
一、突破传统模式
远程操控与动作捕捉技术一直是机器人训练领域的常规手段。以波士顿动力为例,其Atlas机器人便大量采用远程操控进行训练。技术人员需穿戴动作捕捉服完成各类任务,并将采集到的动作数据传输给机器人。这类装备也可用于实现对机器人的远程操控。
目前尚未确认特斯拉是否会在后续阶段重新启用动作捕捉与远程操作系统,或是将视频数据作为现有数据基础上的补充训练资源。
人类与机器认知研究所资深科学家罗伯特·格里芬在接受采访时表示,丰富的远程操控数据能让机器人通过实际环境互动进行学习。他指出,仅凭视频数据教会机器人完成实际动作面临诸多挑战。
“仅依赖视频资料,机器人将缺乏直接的互动体验。”他补充道。
今年5月,特斯拉公布的一段视频显示,Optimus机器人似乎已能根据视频内容完成多项指定任务。
负责Optimus硬件研发的总监康斯坦蒂诺斯·拉斯卡里斯似乎已证实这一新策略。他在5月的领英发文中写道:“这听起来或许不可思议,但我们的机器人确实正在通过观看人类视频直接掌握新技能!”
马斯克同期也公开表示,未来Optimus将具备通过观看YouTube视频自主学习任务的能力。
据内部消息,在技术路线调整期间,特斯拉曾暂停Optimus团队的招聘工作。截至8月末,公司招聘平台上仍开放着50余个与该项目相关的职位。
二、训练模式革新
知情人士透露,在6月之前,特斯拉仍在使用远程操控结合动作捕捉服的方式训练Optimus。由于需要频繁调试设备问题,团队在数据采集效率上受到制约。
自采用新训练方式后,技术人员开始使用5个特制摄像头记录工作场景。这些设备分别安装在员工佩戴的头盔与特制背包上,通过多角度拍摄为AI模型提供精确的空间定位信息。
佛罗里达州立大学机器人实验室主任克里斯蒂安·胡比茨基分析认为,多机位拍摄有助于特斯拉获取更细致的动作细节,“包括关节与手指的精确定位”,从而实现机器人的空间精准操控。他指出,这些视频资料还能强化此前通过远程操作收集的数据集。
参与训练的工作人员会收到详细的动作指导,尤其强调手部动作要符合人体工程学。有内部人员透露,部分员工可能需要持续数月反复练习同一基础动作。
谢菲尔德大学机器人专家乔纳森·艾特肯指出,特斯拉亟需构建能够适应多种场景的通用动作体系。
“在这种量级的项目中,必须建立标准化动作库,否则逐个训练特定动作将遥遥无期。”艾特肯强调。
他进一步说明,特斯拉或可借鉴Physical Intelligence公司的技术路线,通过输入海量示范数据,使机器人掌握可迁移的技能,而非简单地记忆单个任务。
三、面临更大挑战
这一全新训练策略与特斯拉自动驾驶系统的开发思路一脉相承。当同行普遍采用激光雷达与雷达传感器时,特斯拉始终坚持以摄像头为核心采集设备。
特斯拉充分利用其数百万车主车辆采集的数据,这些车辆配备八至九个摄像头。马斯克曾表示,**特斯拉辅助驾驶系统能成功登陆中国市场,正是得益于利用亚洲街道实景视频对AI系统进行的专项训练。
然而在1月的财报会议上,马斯克也坦言,“训练Optimus所需的数据量,最终可能达到汽车训练的十倍以上。”
艾特肯对此评价:“这确实是特斯拉独有的机器人开发模式。目前尚无其他企业进行同等规模的尝试。他们需要的数据量级将与汽车训练持平。”
俄勒冈州立大学人工智能专家艾伦·费恩则认为,对特斯拉而言,训练人形机器人比开发自动驾驶汽车更具挑战性。
“驾驶毕竟属于单一技能领域。”费恩分析道。他认为,仅通过视频学习要求机器人既能理解画面内容,又具备执行能力,“部分技能可通过观察掌握,但更多技能需要在仿真环境或现实场景中反复演练”。
截至发稿时,特斯拉官方未对此事作出回应。
相关攻略
在当前的人工智能(AI)盛宴中,似乎每个科技巨头都在不计后果地“砸重金”,确保不会在这场竞赛中落后。Meta首席执行官马克·扎克伯格也不例外,他正斥巨资确保Meta不会错过人工智能的“大好时机”。在
AI算力需求的爆发式增长,正推动液冷技术向更高端方向演进。近日,微软首席执行官萨提亚·纳德拉(Satya Nadella)在社交平台上宣布,其团队已成功开发出微流体冷却技术——通过细如发丝的微小通道
英伟达和OpenAI达成世纪合作!最新消息,英伟达计划向OpenAI投资最高1000亿美元,OpenAI则要用这笔钱构建至少10GW的AI数据中心,全用英伟达的系统。10GW,相当于400万~500
过去二十多年间,掌握编程技能如同手握开启未来的钥匙。无数小镇青年靠着写代码,改写了命运轨迹,最终在城市扎根。然而随着AI技术崛起,这条上升通道正逐渐收窄。许多基础编码工作,AI编程工具都可低成本完成
北京时间周二凌晨,OpenAI和英伟达联合宣布了一份战略合作意向书,计划为OpenAI的AI基础设施部署至少10吉瓦的英伟达系统,英伟达计划在系统部署过程中投资高达1000亿美元。两家公司表示,第一
热门专题
热门推荐
在追求极致效率的现代软件开发中,一款名为Cursor的AI代码编辑器正引领着开发范式的变革。它被定义为“面向未来的IDE”,其核心理念清晰而有力:将人工智能深度无缝地集成到编码工作流的每一个步骤,为开发者创造一种前所未有的“AI结对编程”体验。 Cursor sh应用场景 那么,这款AI驱动的编辑器
在众多AI图像生成工具中,WHEE凭借其精准的产品定位与持续的功能迭代,正成为越来越多设计师和内容创作者的首选工具。它专注于打造高品质的AI视觉素材生成器,核心使命就是帮助用户快速、高效地获得可直接使用的优质图片素材。 那么,这款AI绘图工具究竟有哪些核心优势?下面我们从其关键特性与功能设计进行深入
在AI绘画工具不断涌现的当下,一款名为NightCafe Creator的应用以其全面的AI艺术生成能力脱颖而出。它不仅是一个简单的图片处理工具,更是一个融合了多种前沿人工智能技术的创意平台,帮助用户轻松实现从构思到成品的艺术创作。 NightCafe Creator是什么? NightCafe C
近期加密货币市场受到宏观经济不确定性及流动性紧缩影响,比特币(BTC)、以太坊(ETH)以及多种山寨币出现明显下行走势,市场情绪趋于谨慎。 比特币近期走势分析 比特币的价格近期表现如何?简单来说,它跌破了几个市场公认的关键支撑位,而且伴随交易量的放大。这种放量下跌的信号,往往意味着多空分歧加剧。无论
蔡司宣布将于6月2日发布一款新镜头,并称其为镜头技术的重大突破,标志着全新纪元的开启。官方仅公布了产品剪影,但措辞暗示其可能带来根本性的技术升级,例如全新光学结构、先进镀膜或对焦系统改进。具体细节需待发布日揭晓。





