李想谈自动驾驶:需3D空间认知投入而非千亿补贴
3月18日消息,理想汽车创始人李想今晚发文,揭开了全球车企与科技公司投入巨资却进展有限的核心原因,并给出理想的技术破局方案。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
李想指出,人类在幼年就通过活动建立了完整的3D物理空间认知,这是安全驾驶的基础。
而行业主流方案一直是用2D视频训练AI,相当于只看行车记录仪就上路。传统BEV架构会丢失高度信息,OCC方案缺少语义信息,AI始终无法像人一样真正理解三维世界,这是行业进展缓慢的关键症结。
针对这一痛点,理想推出核心突破——原生3D ViT三维视觉编码器,让模型从一开始就工作在3D空间,同步完成几何结构与语义理解。
配合自研马赫芯片提供的三倍算力支撑,这套系统可稳定感知500米以上范围,激光雷达则转变为高精度标定工具。
MindVLA?o1实现了空间理解、推理决策、驾驶行为的统一建模,具备多模态思考能力,可在隐空间模拟场景变化。
李想表示,该模型不只是用于自动驾驶,还能适配机器人,正逐步成为通用物理世界智能体,自动驾驶只是物理AI的起点。



相关攻略
谷歌正式宣布安卓Emoji将迎来全面3D化升级,新设计命名为Noto3D。此次更新将重绘系统内约4000个表情符号,旨在通过立体感和更丰富的细节,让表情在沟通中传递更鲜活的情感。更新预计于今年晚些时候开始推送,首批适配设备为Pixel手机,随后将扩展至Gboard、YouTube等应用。与此同时,
3D Warehouse概述 3D Warehouse是什么 说到3D设计领域的宝藏资源库,Trimble公司旗下的3D Warehouse绝对榜上有名。简单来说,它是一个汇聚了海量3D模型的在线平台。从精致的家具摆件、风格各异的装饰品,到恢弘的建筑单体乃至各类交通工具,几乎你能想到的设计元素,都能
想快速将一张图片、一段描述,变成可直接使用的精细3D模型?如今,这不再是耗时数周的复杂工程,而是几分钟内就能搞定的创意流程。这正是前沿生成式3D AI技术——Atlas——所带来的变革。 什么是Atlas? 简单来说,Atlas是一套尖端的生成式3D AI解决方案。它的核心能力在于,仅凭一张参考图像
百度智能云曦灵数字人平台重大升级:高效低成本生成,全场景矩阵打通 从6月20日开始,百度智能云旗下的曦灵数字人平台,将迎来一次堪称革新的重磅升级。这轮升级带来的变化不小:一方面,它让制作出精美的2D或3D数字人变得高效且成本更低;另一方面,更关键的是,它在直播、短视频、对话等核心应用场景之间,实现了
涂鸦,大概是每个孩子与生俱来的表达方式。线条或许歪歪扭扭,颜色也许天马行空,但在他们眼中,那是一个完整的世界。现在,有一款应用,正试图用科技为这些稚嫩的创作插上翅膀。 什么是Drawing with AI and 3D games? 简单来说,这是一款专为孩子设计的创意应用,其核心亮点在于利用人工智
热门专题
热门推荐
5月11日,一则关于Windows 11测试版隐藏功能“低延迟配置文件”的消息,在科技圈引发了广泛关注与讨论。 该功能的核心机制非常直接:当用户执行高优先级交互操作,例如点击启动应用程序、呼出开始菜单或右键菜单时,系统会瞬间将CPU频率提升至最高状态,并维持1到3秒。其设计目标清晰——显著降低系统响
近期,一份来自数码行业的销售统计报告引发了广泛关注。根据知名科技博主“RD观测”披露的数据,截至2026年第18周,iPhone 17系列在中国市场的累计设备激活量已接近3000万台,具体数字约为2919 09万台。 回顾该博主此前发布的追踪记录,可以看出iPhone 17系列的增长趋势相当稳定。数
注册库币KuCoin时,姓名一致性是KYC流程中最常见的卡点。用户需确保注册姓名与身份证件完全一致,包括中文汉字、拼音格式及顺序。常见的错误包括使用昵称、大小写不当、拼音空格问题以及多音字选择错误。仔细核对并遵循平台指引,能有效避免审核失败,顺利完成身份验证。
你的iPad已经陪伴你多久了?三年、五年,还是更久?这个看似简单的问题,恰恰揭示了一个令苹果自身都感到困扰的行业现实。 尽管iPad在全球平板电脑市场中长期占据主导地位,市场优势看似稳固,但其整体销量下滑的趋势却日益明显。一个有趣的现象是,它面临的最强劲对手并非来自安卓阵营,而是那些依然性能可靠、至
刷机是为手机重装系统,主要有卡刷和线刷两种方式。卡刷通过Recovery模式进行,线刷则需进入Fastboot模式并连接电脑使用专业工具。以OPPOA91为例,具体操作应参考官方指引。选择工具时需关注资源库、教程及智能化程度,掌握原理并借助合适工具即可顺利完成刷机。





