5月29日,一场围绕“智能重构——Token经济商业闭环与治理锚点”的闭门研讨会在北京中关村科技园区东城园举行。无问智科CFO贺敏在圆桌环节分享了对物理AI数据基建与Token商业闭环的思考,核心观点很直白:具身智能想要真正落地,数据基础设施得先跑通。
先说几个核心判断。通用大模型的发展速度已经远超预期,ChatGPT从2024年底至今,整个行业日新月异,连“Token”这个概念都开始融入大众生活——各种AI工具的每一次调用,都在消耗Token资源。但到了物理世界,情况完全不同。具身智能面临的数据稀缺度,远远高于自动驾驶和通用大模型。
贺敏坦言,当前行业最大的瓶颈就是数据困境。通用大模型靠的是互联网多年积累的海量数据,迭代快、成本低;而具身智能需要的数据,真机采集成本高、效率低,无本体数据虽然便宜但场景不可控、分布偏移问题突出,仿真数据则需要真实数据作为基础才能解决sim2real gap。这三类数据各有侧重,没有哪一类能单独扛起训练任务。
针对这一难题,无问智科的核心布局是打造物理AI数据基座,他们自研的平台叫“无垠”,战略框架分三层:采集世界、生成世界、模拟世界。
采集世界解决的是数据的来源问题。行业普遍沿用数据金字塔体系——最顶层是真机数据,质量高但采集难度极大;中间层是无本体数据,通过人类穿戴设备采集工作数据,目前在东南亚、印度以及国内多地都形成了专业的采集工厂,属于新兴的劳动密集型数据产业,成本更低、落地效果也更优;底层则是仿真合成数据,可以用来大规模支撑模型预训练。这三层数据各有价值,但真正的突破在于第二层和第三层——生成世界与模拟世界。
生成世界的核心是自主研发垂类世界模型。目标很明确:让模型自己生成无限丰富的数据,从而赋予机器人预测、判断、推理的高阶能力。而模拟世界则基于这套垂类世界模型和可微分物理引擎,打造了一个机器人专属的世界模拟器。它既能在云端让机器人进入模拟环境学习和测评,也能安装在端侧作为操作系统,让机器人在工作中具备自我学习、自我总结、自我进化的能力。
谈到Token商业闭环,贺敏拆解了无问智科的落地思路。他指出,工业场景机器人落地难,根源在于岗位场景非标、作业流程琐碎。无问智科的应对策略是深度联动3C制造等领域的头部生产企业,协同梳理一线岗位的动作技能、标准化SOP体系、交互物体库等,沉淀出高质量工业数据集。
更值得关注的是商业模式的创新。传统的按工作量和License收费的模式,在AI时代显得格格不入。无问智科计划推出以Token计费的新模式——这意味着客户用得越多、价值越大,付出也就越高。这种模式能有效降低客户的决策和信任成本,提高业务标准化程度,也更直观地展现出产品对下游客户的实际价值。随着垂类世界模型逐步成熟,这种以PaaS为主、按Token消耗量收费的商业模式,有望成为行业新范本。

可以确定的是,随着世界模型技术逐步成熟、落地跑通,数据采集与模型迭代形成的Token商业闭环正在加速成形。物理世界的智能化大门,或许比我们预想的更早敞开。
