小米陈龙专访：算法如何让辅助驾驶更安全、更个性化

时间：2025-11-28 10:33

在智能驾驶技术快速迭代的背景下，小米近日通过其最新发布的Xiaomi HAD增强版，向行业展示了在辅助驾驶领域的突破性进展。这款系统不仅实现了从传统端到端模仿学习向“模仿学习+强化学习”模式的范式升

在智能驾驶技术飞速迭代的浪潮中，小米发布的Xiaomi HAD增强版系统展现了其在辅助驾驶领域的突破性进展。这套系统不仅从传统的端到端模仿学习升级到了全新的“模仿学习+强化学习”范式，更创新性地引入VLA（视觉-语言-行为模型）技术，为攻克复杂场景下的决策难题提供了全新方向。

小米智能驾驶VLA技术负责人陈龙介绍，此次增强版的核心突破在于学习机制的深度迭代。传统端到端系统依赖于海量驾驶视频进行模拟训练，而新版本通过世界模型构建的虚拟场景，让模型在反复试错中掌握最佳驾驶策略。这种“正向奖励+反向惩罚”机制，使系统在面对突发加塞、施工占道等极限场景时，决策逻辑更贴近人类防御性驾驶习惯，可靠性与安全性实现显著跃升。

强化学习的应用并非孤例。小米同步推进的世界模型技术，采用“道路环境数据+语言描述”的双输入模式，精准生成适配中国复杂路况的虚拟训练场景。例如，系统能通过语言描述理解不同城市的交通标识差异，进而在虚拟环境中精准模拟北京胡同的窄路会车、上海高架的匝道汇流等特色场景。这种“数据驱动+语言增强”的方案，有效弥合了仿真环境与真实道路的差距，为强化学习提供了高度拟真的演兵场。

VLA技术的引入，直指端到端模型的“黑盒”痛点。陈龙用“宝宝学说话”生动类比：传统端到端如同幼儿模仿发音却不解语义，而VLA通过语言模态的加持，让系统真正具备了“阅读理解”式的推理能力。当遇到训练数据中未出现的场景时，VLA可借助互联网通行数据（如交通规则、物理常识）进行逻辑推导，例如通过识别“圆形红底标识”判断禁止通行，或根据“右转必停”的交通规则调整操作。这种“理解式决策”能力，被行业普遍认为是实现L3/L4级自动驾驶的关键突破点。

在技术路径选择上，小米坚持采用自研基座模型的深度定制方案，而非直接移植开源模型。该模型从大语言模型（LLM）阶段就开始进行数据筛选，深度融合驾驶场景与机器人任务的专项训练，重点强化三维空间感知与推理能力。陈龙透露，这种“通用能力为基础、驾驶场景为重点”的设计理念，使模型既能精准适配车辆驾驶，也可扩展至机器人、家居等跨场景应用，逐步构建起“人车家全生态”的技术协同体系。

针对VLA可能带来的时延挑战，小米通过算力强化与模型优化双管齐下：一方面升级硬件基础设施保障推理速度，另一方面在语言模态输出端精简token，剔除冗余表达，仅保留关键决策信息。这种“效率优先”的优化策略，使系统在提升认知能力的同时，仍能保持流畅的交互体验。

在技术落地优先级排序中，小米明确将算法置于首位。陈龙引用特斯拉前AI负责人的观点指出，当前辅助驾驶的核心矛盾仍在软件层面，硬件与算力仅作为弥补算法短板的辅助手段。例如当算法无法通过纯视觉方案实现高精度感知时，可增配激光雷达提升可靠性；当VLA推理需要更复杂计算时，再通过算力升级保障响应速度。这种“软件定义硬件”的思路，体现了小米对技术本质的深刻理解。

作为较早参与端到端与VLA研发的科学家，陈龙的职业轨迹折射出中国智能驾驶领域的人才聚集趋势。这位35岁的前英国Wayve核心成员在对比国内外驾驶场景后发现，国内道路上电动车横穿、突发加塞等不可预测场景更密集，对系统灵活性与安全性的要求更为严苛。这种本土化需求，加上小米构建“人车家全生态”的愿景，最终促成其回国加入团队。他特别提及小米创始人亲自沟通的经历，强化了自身对品牌价值观的认同——这种“做感动人心的好产品”理念，与VLA技术“让AI落地物理世界”的追求高度契合。

随着Xiaomi HAD增强版随HyperOS 1.1系统推送至用户，小米的智能驾驶技术迈入全新阶段。从端到端到强化学习，从世界模型到VLA，这家以手机起家的科技企业正通过持续的技术深耕，在智能驾驶赛道上构建差异化竞争力。而陈龙带领的团队能否凭借“难但正确”的技术路线，在L3/L4级自动驾驶的终极目标上实现突破，将成为行业后续关注的焦点。

来源：https://www.itbear.com.cn/html/2025-11/1031120.html

上一篇蔚来Q3财报：营收交付创新高，现金储备指引四季度再突破 下一篇柔性屏量产赋能让可穿戴设备突破设计边界

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。