AI出行数据服务商崛起:得场景者得智能驾驶未来
AI行业最核心的竞争资源,正在发生根本性的转变。
随着李飞飞教授“空间智能”理念的提出,产业与资本的焦点正从大语言模型,迅速转向世界模型与具身智能。这标志着AI正从理解符号世界,迈向理解并改造物理世界的新阶段。
然而,当AI试图学习如何与真实世界互动时,一个关键瓶颈暴露无遗:训练这些新型智能体所必需的真实物理世界交互数据,存在巨大的供给缺口。业内普遍认为,高质量交互数据的供需差距可能达到数万甚至十万倍。
原因在于,传统大模型依赖的海量文本和图像是静态的。而具身智能需要的是动态的“感知-决策-行动-反馈”闭环数据。缺乏因果逻辑和交互信息的旧有数据,已无法满足下一代AI的训练需求。
行业亟需一种全新的“数据燃料”:它必须源自真实物理世界,蕴含因果逻辑,并能实现规模化、可持续的产出。
因此,高质量、高保真的物理世界交互数据,已成为当前AI发展的战略级稀缺资源。谁能够以低成本、大规模、可持续的方式生产这类数据,谁就掌握了通往下一代AI的钥匙。
值得注意的是,一个可能被低估的行业,正悄然崛起为AI时代至关重要的物理数据入口——出行服务平台。
许多人未曾意识到,这些我们日常使用的网约车平台,除了提供出行服务,还在通过一项新兴业务创造可观价值:向AI行业提供数据服务。
出行平台,如何靠数据开辟第二增长曲线?
出行服务行业正在探索一条全新的商业化路径。凭借在真实道路场景中积累的海量一手数据,领先的平台正将数据资产化、产品化,成功开辟出强劲的第二增长曲线。
更值得关注的是,这条路径的商业可行性已被验证,并有企业公布了具体的财务数据。
率先披露详细进展的,是广汽集团旗下智慧出行平台——如祺出行。
根据其2025年财报,以AI数据服务为核心的技术服务业务,已成为公司增速最快的板块。
这项AI数据业务,由如祺出行内部的数据业务板块(即“如祺数据”)运营,最早于2023年开始布局。当时,如祺出行获得了乙级测绘资质,并开始将搭载激光雷达、高精度惯导、多视角摄像头等全套传感器的智能驾驶数据采集车辆,投入常态化运营。
这些车辆在正常提供网约车服务的同时,也在合规、持续地采集真实的驾驶行为与道路环境数据。如祺数据的技术与服务能力,也随着数据采集的广度和深度不断拓展。
近期,如祺数据首次系统性地对外公布了其AI数据资产与能力全景图。
信息显示,其数据资产已形成标注数据、行为数据、合成数据及多模态训练数据集四大产品矩阵,覆盖从原始数据采集、加工处理到最终交付的全链条。其中,标注数据是基础;行为数据完整记录了人类驾驶员在实际复杂交通环境中的操作与决策逻辑;合成数据用于高效生成雨、雾、雪、夜等罕见长尾场景;多模态数据集则融合了图像、文本、点云、音频与视频,可直接用于垂直领域大模型的微调与训练。
在数据规模方面,如祺数据已构建起一张覆盖多城的采集网络。截至2026年5月,公司在广州、上海、重庆、沈阳等核心城市部署了超过300辆智能驾驶数据采集车。经过近三年的常态化运营,这些车辆日均产出数据达1600小时、130TB;平台累计沉淀了千万量级的高价值驾驶场景片段。
这些场景片段,本质上是物理世界交互过程的完整“时空切片”,包含了丰富的因果与决策信息。
当然,规模是基础,商业化成果才是检验模式成功与否的关键。
财报数据显示,2025年,以AI数据服务为主的技术服务板块,实现营收1.6亿元,同比大幅增长487.4%。这一惊人的增速清晰地表明,市场对高质量物理世界交互数据的需求正在急剧爆发。
其客户结构也印证了需求的广泛性。据了解,其服务已覆盖智能驾驶、具身智能、大模型、消费电子、智慧医疗等多个前沿领域;腾讯、小马智行、理想汽车、火山引擎、百度智能云、广汽集团等头部科技及车企均是其重要客户。
这意味着,从出行服务中衍生出的数据业务,已具备跨行业解决实际AI数据需求的能力,并成功跑通了从数据采集、加工处理到商业化交付的完整闭环。
这一转变,正在重塑外界对出行平台的认知。具备全链条数据服务能力的如祺,已不再仅仅是一家出行服务商或传统的数据标注公司,而是演进为一家提供“标准化数据集+全栈数据能力”的综合解决方案服务商。这种闭环的数据生产与服务能力,正成为驱动下一代AI发展的关键基础设施。
出行平台,为何能成为AI时代的数据基础设施?
要理解出行平台的这一角色跃迁,需要回答两个核心问题:为何AI行业极度渴求物理世界数据?以及,出行平台为何能完美填补这一缺口?
这需要从李飞飞教授对世界模型的阐述入手。她指出,当前主流大语言模型存在一个根本性局限:缺乏“空间智能”——即像人类一样感知、理解并在三维物理世界中行动的能力。因此,需要构建一种新型的AI系统,即“世界模型”。
一个合格的世界模型,需要满足三大核心特征:生成性、多模态性、交互性。
这意味着,训练下一代AI所需的数据,必须同时具备这些特征,尤其是“交互性”——数据不能仅是静态的环境记录,必须包含“动作-状态变化-环境反馈”的完整因果链条。
然而现状是,行业能稳定获取的此类交互数据严重不足。传统的数据供给方式主要有三种,且各有明显短板:
- 其一,从互联网爬取公开图片和视频,数据多为被动记录,缺乏交互与因果信息;
- 其二,在实验室或仿真环境中人工搭建场景,成本高昂,且与真实世界存在“仿真鸿沟”;
- 其三,采用众包模式采集,数据质量、一致性和安全性难以保障。
短期内,这三种方式都难以持续、低成本地生产出带因果标签的高保真交互数据。这正是行业面临的核心痛点:高质量、带交互标签的物理世界数据极度稀缺,供需之间存在巨大鸿沟。
正是在此背景下,出行赛道展现出了生产这类高价值数据的独特优势。
与传统采集方式不同,出行平台的数据采集是“业务即采集”。每一辆数据采集车,都是一个移动的智能感知单元,在完成日常客运服务的同时,同步记录下“驾驶员决策—车辆控制—环境反馈”的完整交互序列。
这种源于真实业务的数据天然具备多模态时空对齐、时序连续和强因果逻辑的特征。以如祺展示的自动泊车场景数据为例:它不仅包含3D障碍物位置信息,还同步采集了车辆底盘CAN信号(反映方向盘转角、油门刹车状态)、毫米波雷达点云、激光雷达点云与多视角摄像头视频流。这些多模态数据围绕同一泊车事件,形成了“行为(操作指令)-状态(车辆响应)-环境(实时反馈)”的联合标注数据集。
在训练AI模型时,这类数据不仅能提供“是什么”的感知信息,更能教会模型理解“为什么”以及“怎么做”,例如为何选择特定路径避障、如何判断车位是否可用等需要物理常识和因果推理的复杂任务。业内人士认为,这类具备完整决策反馈链条的数据,是训练空间智能模型的“黄金数据源”。
基于这一独特的数据源头,如祺数据系统性地构建了其全链条数据服务能力。在技术层面,其自研的OCC自动化标注算法,采用同源底图与自动化流程,可减少90%的人工标注工作量,交付准确率超过98%。合成数据引擎能够一键生成雨、雾、雪、夜间等低可见度长尾场景,有效弥补真实采集的盲区;多模态数据集产品则覆盖图像、文本、点云、音频与视频,可直接用于行业大模型的垂直领域微调与训练。
这套能力的本质,是将其在自动驾驶领域经过验证的整套数据工程化经验——从合规采集、规模化清洗、高精度标注到合成数据增强——产品化、标准化。客户得以“开箱即用”,无需从零搭建底层数据管道,就能直接获得深度加工的高质量数据集与配套工具链。
在这一方面,如祺数据的思路与Scale AI有异曲同工之妙:不仅提供数据本身,更提供一套让客户能“更高效理解和使用数据”的工具与方法论,从而显著降低高质量物理数据的使用门槛,加速客户的模型迭代效率。这也使其数据能力的应用边界,得以从自动驾驶拓展到具身智能、通用大模型、消费电子、智慧医疗等更广泛的领域。
可以说,数据规模与处理能力是基石,而出行平台更大的想象空间,在于其以出行场景为原点,将数据能力向更广阔物理世界泛化的潜力。这再次印证了AI发展的一条铁律:得“场景”者,得天下。
得“场景”者,得天下:物理数据入口的价值重估
当AI迈向物理世界,行业的竞争逻辑正在发生深刻变化——从纯粹算法的竞争,转向对核心场景的争夺。
正如移动互联网时代,基于位置的服务(LBS)催生了新的数据金矿;云计算成为了数字经济的通用底座。在AI走向“空间智能”的今天,那些能够持续、低成本产出真实物理世界交互数据的「高频场景」
一个行业共识正在形成:优质的物理场景比优秀的算法更为稀缺。算法可以被开源和复现,但一个真实、高频、能产生闭环交互数据的物理场景,却极难被复制。数据本质上是场景运行的“副产品”,掌握了场景,就掌握了持续产生数据飞轮效应的源头。
出行平台,正是这样一个近乎理想的“元场景”:它覆盖了海量、开放的公共道路空间,涉及持续的人-车-环境共驾决策,每天产生数以亿计的交互事件。这些要素的结合,构成了一个天然的、高价值的数据生产系统。
更重要的是,出行平台采用的“运营即采集”模式,在成本上具有颠覆性优势。传统的专业数据采集需要投入专用车辆、驾驶员和封闭场地,成本高昂,难以规模化。而像如祺出行这样的平台,其数据采集车本身也是营运网约车,在创造营收的同时完成数据采集,使得数据的边际成本被极大摊薄。
这种数据能力的潜力,远不止于驾驶场景本身。据悉,如祺正在尝试将其在“人-车-环境”交互中积累的数据能力,泛化至更多应用领域。例如,探索具身智能在车后服务场景的落地,包括自动洗车、智能换电、车辆维保、内部清洁等。车后服务是出行场景的自然延伸,也是其数据积累深厚的领域,能够形成真实的商业服务闭环。而这些场景中机器人所需的避障、路径规划、精细操作等核心能力,与自动驾驶在数据层面具有高度的同构性。
这种“低成本、高交互、可持续”的数据生产模式,一旦在某个垂直场景被验证成功,便具备了复制到其他相似物理交互场景的潜力,甚至可能成为行业的通用数据解决方案。
一个长期的趋势正在显现:未来,那些拥有深厚物理场景运营经验的企业,其核心资产可能不仅是其提供的服务本身,更是其业务过程中持续产生的、富含因果逻辑的场景交互数据。这些数据经过系统性的治理、加工与产品化,足以反哺并深刻影响整个AI产业的发展轨迹。
像出行平台这样的巨型物理世界接口,其身份正在双重化:在消费者端,它仍是提供便捷出行服务的平台;而在产业端,它已进化成为AI理解并进入真实世界的、不可或缺的物理数据入口与基础设施。
相关攻略
AI行业最核心的竞争资源,正在发生根本性的转变。 随着李飞飞教授“空间智能”理念的提出,产业与资本的焦点正从大语言模型,迅速转向世界模型与具身智能。这标志着AI正从理解符号世界,迈向理解并改造物理世界的新阶段。 然而,当AI试图学习如何与真实世界互动时,一个关键瓶颈暴露无遗:训练这些新型智能体所必需
3月31日消息,3月31日,如祺出行发布截至2025年度全年业绩公告。报告期内,如祺出行核心财务指标全面向好,除录得总收入52 86亿元,同比大增114 6%,年内订单量、交易额均录得翻倍增长,利润
文|财华社当网约车市场陷入存量博弈的红海,Robotaxi成为出行平台争相抢占的新赛道。如祺出行(09680 HK)、曹操出行(02643 HK)等车企系玩家,一边凭借母公司资源在传统网约车业务中突
热门专题
热门推荐
加密货币市场突遭重挫:深度解析与应对策略 近期加密货币市场重挫,比特币(BTC)一度跌超13%,以太坊(ETH)跌幅更是一度超过20%,投资者情绪高度紧张,市场波动剧烈。 主要币种跌幅概览 这轮下跌来得又快又猛,各主要币种的“受灾”情况可谓一目了然。具体来看: 比特币(BTC):作为市场风向标,短时
10月11日,加密货币市场经历剧烈波动,单日爆仓金额与人数双双突破历史纪录。市场行情极端变化导致大量杠杆交易者被强制平仓,凸显了加密货币投资的高风险特性。这一事件再次引发对市场波动性与风险管理的广泛关注。
过去24小时内,加密货币市场剧烈波动,导致全网大量交易者仓位被强制平仓。数据显示,爆仓人数高达162万,涉及金额巨大。市场普遍认为,此次暴跌与多重因素相关,包括宏观经济预期变化、监管政策不确定性以及部分大型投资者抛售行为。这一事件再次凸显了加密货币市场的高风险特性。
加密货币市场经历约160亿美元清算冲击后进入缓慢筑底阶段。高杠杆集中、价格波动加剧及恐慌情绪扩散引发连锁清算。比特币与以太坊反弹空间有限;瑞波币抗跌但波动加大;Solana受冲击明显。投资者应控制杠杆、分批建仓并关注市场动态。
加密货币市场剧烈波动,过去24小时内全网爆仓金额升至191亿美元,创下历史新高。市场多空博弈激烈,杠杆交易者大量被强制平仓,凸显了高杠杆交易在极端行情中面临的巨大风险。





