自动驾驶已实现通用人工智能汽车本质是机器人
自己夸自己千句,不如旁人赞你一句。
这话放在科技圈也一样。马斯克在播客和推特上没少夸特斯拉的自动驾驶和机器人“天下第一”,但听多了,难免让人觉得有些“王婆卖瓜”。不过,最近情况有点不一样。AI领域的顶尖专家安德烈·卡帕西(Andrej Karpathy)在一档名为《No Priors》的播客节目中现身,分享了不少他在特斯拉工作时的内部观察,以及对行业未来的深刻见解。这些来自“前朝重臣”的一手信息,显然更有分量。
卡帕西的履历堪称传奇:早年追随马斯克从OpenAI转战特斯拉,从零开始搭建了特斯拉的自动驾驶视觉团队,是FSD(完全自动驾驶)核心技术的奠基人之一。然而,随着团队壮大,他的角色从技术专家转向管理者,这与他醉心于从零构建事物的初衷相悖。于是,他做出了那个“艰难的决定”,在团队能够自主运行后,离开了特斯拉。
此后,他短暂回归OpenAI,又因相似原因离开。今年七月,他创立了自己的初创公司Eureka Labs,专注于AI与教育的结合。尽管已自立门户,卡帕西对特斯拉的感情依然深厚。在访谈中,他毫不掩饰对特斯拉在通用人工智能(AGI)、机器人及自动驾驶领域布局的赞赏,甚至透露了未来可能重返特斯拉的意愿。
在这场信息量巨大的对话中,卡帕西不仅回顾了特斯拉在自动驾驶和人形机器人上的技术路径,更分享了他对Scaling Law(规模定律)、AI发展瓶颈以及AI教育未来的独到思考。
自动驾驶:软件与硬件的路线之争
当被问及自动驾驶技术的现状时,卡帕西给出了一个大胆的判断:当前的自动驾驶系统,在能力上已经接近AGI的水平。 他回忆,十年前第一次体验Waymo的演示时,其在一个封闭街区内的表现就已近乎完美。十年过去,这项技术终于从演示走向了商业化产品。
那么,阻碍其全面普及的到底是什么?是技术还是监管?
卡帕西认为两者皆有。从演示到实际部署,需要处理海量的“长尾问题”;而全球范围内的法规批准更是漫长。但他对特斯拉的路线充满信心,并直言不讳地比较了特斯拉与Waymo的差异:
“很多人认为Waymo领先,但我认为特斯拉更具优势。特斯拉的核心是软件问题,而Waymo更多是硬件问题。软件问题比硬件问题更容易解决。”
他进一步解释,特斯拉已经实现了全球规模的车辆部署,而Waymo仍在为规模化挣扎。一旦特斯拉的软件方案彻底跑通,其爆发力将非常惊人。他刚刚体验了特斯拉的最新版本,对其表现印象深刻。
关于特斯拉备受争议的“纯视觉”方案,卡帕西透露了一个关键细节:特斯拉在训练阶段其实使用了包括激光雷达在内的多种昂贵传感器来构建高精地图和收集数据,只是在最终车辆部署时移除了这些传感器。 这种“训练用多传感器,部署用纯视觉”的策略非常聪明,既利用了多源数据优化算法,又保证了量产车的成本与可靠性。
至于从传统模块化架构转向“端到端”深度学习,卡帕西指出这正是特斯拉明确的方向。系统里的C++代码正在被神经网络逐步取代。他预测,未来理想的系统将是直接输入视频流,输出驾驶指令的纯神经网络。当然,这需要克服监督信号不足等挑战,而中间层的表征学习将是关键。
人形机器人:特斯拉是一家机器人公司
谈到特斯拉的Optimus人形机器人项目,卡帕西的观点非常鲜明:“特斯拉本质上是一家机器人公司,而非汽车公司。”
他解释说,汽车本身就是一种机器人。而特斯拉真正的核心竞争力在于“规模化制造”的能力——不仅是制造产品,更是制造生产产品的机器。这种能力可以无缝迁移到人形机器人上。
“事实上,早期版本的Optimus机器人一度‘以为’自己是辆汽车,”卡帕西分享了一个有趣的细节,“因为它使用了完全相同的计算机和摄像头,运行着汽车的算法。它在办公室里移动,试图识别‘可驾驶空间’,而实际上它面对的是步行空间。” 这个例子生动地说明了技术迁移的可行性与初期需要做的适配。
Optimus项目的启动速度之快,也印证了特斯拉内部积累的深厚工程能力。马斯克一声令下,所有的工具链、供应链、制造经验都能迅速被重新配置到机器人项目上。
对于人形机器人的商业化路径,卡帕西给出了一个务实的推演:
- 内部孵化:首先在自家工厂应用,处理物料搬运等任务,规避早期B2B合同的法律与安全复杂性。
- B2B拓展:随后进入拥有大型仓库的企业市场。
- B2C普及:最后才是进入消费级市场。
他特别提到了一个让他兴奋的“吹叶机挑战”:希望未来Optimus能灵巧地捡起街上的每一片落叶,取代噪音巨大的传统吹叶机。
为何要坚持“人形”设计?卡帕西给出了几个核心理由:
- 集中化研发:每个机器人平台的固定成本极高,聚焦于一个通用平台(人形)更经济。
- 数据收集优势:人类可以轻松地为“人形”机器人进行动作演示和数据标注,这常被忽视。
- 多任务学习:如同大语言模型在统一文本领域学习各种任务,一个通用的人形平台能让AI在不同物理任务间共享知识,实现能力迁移。
Scaling Law与“数据墙”:架构已成熟,数据是王道
作为Transformer架构的布道者之一,卡帕西盛赞其革命性意义。他认为Transformer不仅仅是一个神经网络,更是一个“可微分计算机”,其出现让Scaling Law变得清晰可见,是算法领域一个偶然发现的“奇迹”。
然而,他认为当前AI发展的瓶颈已经转移。“神经网络的架构不再是瓶颈,至少Transformer不是了。” 他指出,像Llama这样的主流模型,其架构相比五年前并无根本性变革,微小的调整只能带来个位数的性能提升。
真正的瓶颈在于数据。互联网上的公开文本数据只是一个“近似解”,并非AI训练的“理想数据”。我们真正需要的是能反映人类思维链条和推理过程的“内心独白”式数据。
因此,合成数据将成为未来的关键。但卡帕西发出了重要警告:必须警惕合成数据导致的“模式坍塌”和“熵减”。如果让AI生成训练下一代AI的数据,很容易陷入输出越来越单一、缺乏多样性的循环,最终导致数据集“贫瘠化”。
他举例说,就像让ChatGPT讲笑话,它可能反复只输出那几个套路。解决之道在于精心设计数据生成过程,例如为合成数据注入丰富的角色和背景,强制模型探索更广阔的可能性空间,以保持数据集的“活力”。
人工智能与未来教育:AI作为“学习伴侣”
最后,卡帕西谈到了他目前全心投入的AI教育领域。他深受“一对一辅导能极大提升学习效果”这一经典研究的启发,认为AI的终极目标不应仅是替代人类,更应是赋能于人。
他构想的未来教育模式是:由人类顶尖教师负责设计核心课程内容与教学法,而AI则扮演前端的“超级助教”角色。 这个AI助教可以7x24小时以任何语言与学生互动,解释概念、答疑解惑、引导学习路径,从而实现高质量的个性化教育普惠。
当然,他也承认,当前AI在“适应性学习”方面还处于非常早期的阶段。现有的模型擅长翻译和呈现内容,但要真正理解学生的学习状态、知识背景并动态调整教学策略,还有很长的路要走。目前看到的更多是演示效果,而非成熟产品。
卡帕西的这次分享,像是一次坦诚的“技术复盘”。他从亲历者的视角,勾勒出特斯拉在自动驾驶和机器人领域独特的技术哲学与务实路径,同时也以前瞻者的眼光,指出了整个AI行业在数据与教育应用上面临的挑战与机遇。这些思考,无疑比任何宣传口号都更有价值。
相关攻略
人工智能技术正为中国市场开启新的发展窗口。业界观点指出,AI在产业应用层面带来了切实机遇,其与制造业、医疗、金融等领域的融合不断深化。技术迭代与算力发展正推动传统行业数字化转型,而构建健康的技术生态与人才培养体系,将是把握这一机遇、实现可持续发展的关键。未来,人工智能有望在更广泛的场景中创造价值。
数字孪生技术作为驱动数字经济高质量发展的核心引擎,其应用版图正从智慧城市、智慧水利加速拓展至能源电力、交通运维、智慧仓储等关键领域。产业落地进程持续提速,市场规模年复合增长率超过30%——在这蓬勃发展的浪潮之下,一个严峻的现实挑战也浮出水面:行业专业人才缺口已超过百万大关。 特别是那些既精通三维可视
在刚刚结束的一季报业绩说明会上,中芯国际联合CEO赵海军向市场传递了明确的乐观信号。基于当前清晰的客户需求与在手订单状况,公司对今年整体运营情况的展望,较上一季度显得更为积极。 这份乐观并非空xue来风,其背后是多重动能的强劲支撑。首要驱动力,无疑是人工智能浪潮对配套芯片的强劲需求,直接导致了公司电
机器人连续运行超过30小时无需停机——这并非科幻情节,而是正在直播中真实呈现的工业自动化突破。 据《科创板日报》15日报道,Figure公司创始人布雷特·阿德科克正式宣布,其最新一代F 03机器人已在公开直播环境下,实现了超过30小时的不间断作业。尤为关键的是,在整个运行周期内,系统未发生任何计划外
据《科创板日报》独家披露,百度近期对其人工智能业务的组织架构进行了一次重要升级,核心举措是成立了全新的“百度模型委员会”(Baidu Model Committee,简称BMC)。 据悉,该委员会成员以对AI大模型技术有深刻理解和前瞻视野的年轻研究员为主。在组织架构上,百度的基础模型研发部(BMU)
热门专题
热门推荐
近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十
科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,
SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。
NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。
OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。





