近日,AI数据领域迎来一项重要动态:曼孚科技正式宣布完成数亿元Pre-C轮融资,本轮由五源资本领投,同创伟业、招银鼎洪跟投。所募资金将主要用于核心技术平台的建设,涵盖AI数据生成平台、Agent平台以及自有Eval体系等。其目标清晰而明确——构建完善的AI数据生产与评测系统,致力于成为AI数据产业的“台积电”。
人工智能正以前所未有的速度重塑世界,大模型的能力呈现指数级跃迁,而AI产业的竞争焦点也在悄然转移。如果说过去十年,核心在于算法与算力;那么未来十年,数据质量、反馈质量以及评测体系,将成为决定AI能力上限的关键变量。一个全新的产业形态正在浮现——AI数据生产与评测系统。正如半导体制造从IDM模式升级为纯晶圆代工,AI数据行业也正从传统的“数据标注”迈向更复杂、更工程化的数据生产与评测体系。
一、AI数据产业的必然升级:从富士康到台积电
在电子工业时代,富士康代表的是规模化制造能力,而台积电则代表着先进制造与芯片评测体系。今天的AI数据产业,正处在类似的历史拐点。
传统的数据标注公司,本质上是AI时代的“富士康”——依靠人力规模化完成基础数据生产。但未来真正的AI数据企业,必须像“台积电”一样:不只是提供人力,更要构建完整的数据生产、反馈和评测能力。具体包括哪些?例如面向监督微调(SFT)的高质量训练数据,面向强化学习与偏好优化的数据生产(RLHF/Preference Data),面向Agent能力提升的轨迹数据、环境数据与评测数据,面向复杂场景的专业领域数据与专家反馈,以及人机协同的评测与质量控制体系等。
为应对这一趋势,曼孚科技搭建了三大核心平台:AI数据生成与合成平台(覆盖各类RL环境等)、通用Agent平台(支持复杂长程任务规划与执行)、自有Eval体系(快速验证model/agent在非公开benchmark上的表现)。依托这些平台,曼孚实现了工业级、体系化、可规模复制的数据制造与评测能力,为大模型的迭代升级提供了坚实支撑。
二、Token:AI时代的“电力消耗”,曼孚千亿日耗诠释AI生产力
在AI时代,判断一家公司的技术实力,不能只盯着模型参数,更要看Token消耗量。Token正在成为AI时代最真实的生产指标——正如电力消耗代表工业规模,算力消耗代表互联网规模,Token消耗则代表AI生产力。
目前,曼孚科技的日Token消耗量已达到千亿级别。这意味着什么?说明曼孚不仅是一家AI数据公司,更是一家真正深度融合AI的平台型企业。因为只有将AI深度融入生产流程的企业,才会产生如此规模的Token消耗。
三、万亿美金的大模型公司 VS 千亿美金的AI数据公司
今天,全球科技产业正站在新的临界点。万亿美金级别的大模型巨头(如OpenAI)已立于潮头。而在这些巨头身后,一个同样巨大的产业正在崛起——AI数据产业。算力是AI的发动机,算法是AI的操作系统,那么数据,就是AI的燃料。未来的AI竞争,本质上就是谁拥有更先进的数据生产与评测能力。
因此,在万亿美金的大模型巨头背后,千亿美金级的AI数据公司必将应运而生。正是在这样的产业趋势下,曼孚科技正积极构建面向大模型时代的AI数据基础设施。未来十年,AI产业的竞争将不再只是模型参数和算力规模的比拼,更是AI数据生产与评测体系的较量。谁能够构建领先的体系,谁就能成为AI时代的关键基础设施——正如台积电之于半导体产业。而曼孚科技的目标,正是成为AI数据产业的台积电。
