8月28日最新消息,经过数年的技术迭代,我国自动驾驶产业已探索多种技术路线。
从最初依赖高精地图到BEV鸟瞰视角技术,再演进至无需高精地图的城市NOA,2024年最具热度的"端到端大模型"技术不断发展。而随着理想、小鹏和元戎启行等企业的布局,"视觉-语言-动作"(VLA)正成为当前主流方案之一。
VLA技术是指将视觉感知、语言推理与车辆控制端到端整合的智能驾驶解决方案。
作为国内自动驾驶领域的标杆企业,华为对VLA持何种态度?是否会跟进这一技术路线?
近日,华为智能汽车解决方案BU CEO靳玉志在采访中给出了明确回应。
靳玉志表示,采用VLA路线的厂商认为,通过OpenAI等语言大模型学习网络信息后,可将知识以语言模型(LM)的形式进行存储和应用。VLA技术尝试在成熟的LM基础上,将视频数据转化为语言标记(token)进行训练,最终输出车辆控制指令。
"华为不会采用VLA技术路线,我们认为这看似捷径,实则难以实现真正的自动驾驶。我们更看好世界模型(WA),即World Action,跳过语言处理环节直接实现感知与控制的闭环。"
靳玉志强调,WA路线虽然更具挑战性,但代表着实现真正自动驾驶的正确方向。
他详细解释道,WA技术的核心在于通过视觉等感知信号直接控制车辆,而非将感知信息转换为语言再经由大模型处理。这里的感知信号不仅限于视觉,还包括声音、触觉等多种模态。
"华为坚持WA技术路线,虽然目前难度较大,但这是实现真正自动驾驶的必由之路。"靳玉志坚定表示。
他还透露了华为智驾产品的发展规划:2026年实现高速L3级和城区L4试点;2027年开展无人干线物流试点及城区L4规模化商用;2028年力争实现无人干线物流的规模化商用。

