上海企业如何突破AI数据瓶颈把握新时代竞争关键


在上海浦东的一间办公室里,一份关于“具身智能数据合成”的技术报告被反复研讨。这并非普通文件,而是王长冕及其团队近期攻坚的核心课题。2025年5月,这位在人工智能领域深耕多年的技术专家,做出了一个备受业界关注的职业选择:加入成立仅一年的上海库帕思科技有限公司,并出任首席技术官。这一决定背后,是对人工智能发展新阶段的精准洞察:高质量数据,正成为决定AI模型性能与产业落地的关键胜负手。
当前,大模型的竞争焦点已发生深刻演变。从早期的算法创新比拼,到中期的算力规模竞赛,如今已全面进入“数据质量”决胜的深水区。无论是模型能力的迭代跃升,还是行业场景的深度融合应用,都日益依赖于大规模、高价值、多模态语料的坚实支撑。王长冕团队所专注解决的,正是制约AI发展的核心“数据瓶颈”。他们的使命清晰而坚定:响应国家人工智能发展战略,构建一个覆盖语料采集、清洗、标注、合成、管理全生命周期的综合性数据解决方案平台。
从“人类可读”到“AI可用”:数据需求的范式革命
“过去二三十年互联网为人类所积累的数据,已被当前主流大模型基本消耗殆尽。”王长冕的观察,道出了行业普遍面临的数据荒挑战。然而,更深层次的变革在于,随着大模型、多模态AI以及智能体技术的飞速演进,人工智能对数据的需求本质发生了根本性转向——从服务于人类浏览的“展示型数据”,转变为驱动机器学习的“训练型数据”。换言之,市场亟需的是经过深度处理、符合模型认知逻辑、真正达到“AI就绪”标准的高质量语料。
库帕思科技的成立,正顺应了这一时代需求。作为中国首家专业的人工智能语料数据平台型企业,其于2024年3月正式创立。王长冕加入后,迅速带领技术团队启动“三大体系重构”:首先,依托核心的“语料魔方”技术,重构语料供给的方法论与工具体系;其次,以“AI Ready”为核心理念,重构底层数据基础设施;最后,以构建健康、可持续的数据供需闭环为目标,重构整个语料服务产业的生态格局。
突破“数据瓶颈”:赋能具身智能与智慧医疗
尽管挑战艰巨,但库帕思的进展令人瞩目。2025年11月,公司连续申请了“具身智能数据合成与标注方法”等多项核心技术专利,标志着其在关键技术上取得实质性突破。公司与智元机器人达成深度合作,成功完成了数千万帧级的真实机器人操作数据采集与同等规模的仿真环境数据合成任务。此外,库帕思还成功中标临床医疗人工智能语料集建设项目,旨在为医疗影像诊断、辅助决策等AI模型,构建一个高质量、高可信度、符合伦理规范的专业语料基座。
“诸如临床医疗等关键领域的稀缺数据,正逐步授权由我们进行专业化运营。”王长冕透露。这些天然具有高壁垒、获取难度极大的数据,经过库帕思的精细化加工与脱敏处理,能够直接赋能前沿科研与产业应用。例如,利用其处理后的高质量肠胃镜影像数据训练AI模型,最终“使模型在病灶识别准确率等关键指标上表现极为出色”。这充分验证了专业化、高质量语料对于垂直领域AI模型性能提升的决定性作用。
上海的沃土与担当:区位优势与产业责任
将事业扎根于上海,王长冕认为“具备天然的独特优势”。上海不仅是国内人工智能头部企业与高端研发人才的汇聚高地,更重要的是,地方政府对AI产业的战略布局具有前瞻性,并提供了强有力的政策支持。作为国有控股的混合所有制企业,库帕思还承担了部分公共数据要素化运营的试点职能,这为公司接触多元数据资源、参与国家级重大项目提供了宝贵机遇。
与此同时,上海蓬勃发展的创新创业生态,尤其是大量涌现的“一人公司”等轻量化创新主体,成为了库帕思重点服务的新兴客户群。为回馈这片创新热土,2026年3月,库帕思牵头发布了“模塑申城语料普惠计划2.0”,宣布将面向广大中小企业、高校及科研院所师生、创新创业团队,免费开放部分核心语料数据服务。该计划目标明确:至2027年底,链接超过500个创新主体,打造不少于300个稀缺垂直领域数据集,累计普惠提供市场价值不低于1.5亿元的语料资源。“这有望形成示范效应,有效降低AI创新门槛,整体提升上海人工智能产业的创新活力与竞争力。”王长冕如此展望。
稳固的底层基石:数据驱动的永恒命题
当前,AI大模型的迭代周期已缩短至以月甚至周为单位,这让许多从业者倍感压力。然而,无论上层模型架构与技术路线如何快速演变,一个底层逻辑始终坚如磐石:对更高品质、更大规模、更富多样性的训练数据的需求是永恒且不断增长的。正是基于这一深刻认知,王长冕与团队持续聚焦“全流程覆盖、多模态处理、高度自动化与智能化”的核心技术战略,致力于夯实人工智能产业的数据基础设施。他们的工作,不仅是为企业客户提供数据解决方案,更是为上海打造具有全球影响力的人工智能创新发展高地提供关键支撑,旨在强化我国在全球人工智能数据要素市场中的竞争力与规则制定话语权,最终助力构建开放、协同、繁荣的全球人工智能产业生态。
原标题:《“过去积累的数据已经消耗完了”,上海这家公司如何攻关AI时代新胜负手?》
栏目主编:张骏 题图来源:上观题图
来源:作者:解放日报 胡幸阳
相关攻略
近日,一份题为《双向赋能:AI与游戏的协同进化》的行业白皮书发布,迅速在游戏与人工智能领域引发高度关注。该报告由大湾区人工智能应用研究院携手完美世界、三七互娱、腾讯开悟共同编撰,系统性地剖析了AI与游戏产业之间“你中有我,我中有你”的深度共生关系。报告不仅探讨了AI技术如何变革游戏开发与体验,更将视
对着智能鼠标用藏语提问,大模型不仅能精准理解,还能用带着“酥油茶香”般地道韵味的藏语流畅回答——这不是科幻场景,而是刚刚在第二十八届中国北京国际科技产业博览会现场上演的真实一幕。 本届北京科博会于5月8日至10日举行。展台上,这款名为“DeepZang”的藏语大模型吸引了众多关注。其背后的研发者,西
2026年,人工智能已深度融入职场,成为重塑工作模式与竞争格局的核心驱动力。当前最显著的趋势表明,企业竞争的关键已从技术工具的比拼,转向如何重新定义并释放“人的独特价值”。尽管业界普遍认同组织与个人的敏捷适应力是制胜核心,但多数企业的管理实践与战略愿景之间,仍存在巨大执行落差。在这个技术迭代周期以月
2026年5月6日,AMD首席执行官苏姿丰博士就公司AI战略布局作出重要阐述,正式公布了基于ARM架构竞争背景下的下一代处理器发展规划,明确了AMD在人工智能计算时代的核心技术路线图。 根据官方披露,AMD即将推出代号为“Venice”的第六代EPYC服务器处理器。该处理器将采用全新的Zen 6核心
近期,科技行业围绕一个议题展开了广泛讨论:在人工智能浪潮的冲击下,那些仅专注于“人员管理”的管理者,其角色是否正面临挑战? 爱彼迎(Airbnb)首席执行官布莱恩·切斯基近期公开分享了他的见解。他指出,未来,那些仅仅负责人员协调、频繁召开周期性一对一会议的管理者,其生存空间可能受到挤压。“我不认为这
热门专题
热门推荐
微星PRO MAX系列ATX 3 1全模组电源现已于京东平台全面上市。该系列精心规划了850W、1000W与1200W三档功率规格,全线产品均严格通过80PLUS白金能效认证,为用户带来高效节能的供电体验。首发期间,850W版本售价579元,1000W版本679元,1200W版本799元,参与晒单活
行业首款集成视觉能力的AI智能耳机即将面世。光帆科技近日正式宣布,其创新产品“光帆全感AI耳机”定于5月15日全面发售。这款耳机以“全感知、主动式、个性化”为核心定位,旨在彻底革新用户与可穿戴音频设备之间的交互模式。 本质上,它颠覆了传统耳机的被动响应模式。根据官方介绍,这款AI耳机能够主动感知并理
止损是交易中控制风险的关键手段,在币安等交易平台设置止损时,主要参考市场波动率、技术分析关键位以及个人风险承受能力。合理的止损应基于对价格走势的客观判断,而非情绪化决策,同时需结合仓位管理,避免因单次止损过大而影响整体资金安全。动态调整止损位以适应市场变化,是提升交易纪律性的重要环节。
过去两年,要问大模型最习惯用什么格式交付内容,答案多半是Markdown。 原因不难理解:Markdown足够干净,没有冗余格式,复制到文档、知识库、GitHub,甚至直接粘贴到微信公众号后台,基本都不会出问题。某种程度上,它已经被公认为AI时代最理想的标记语言。 不过,随着Agent时代的到来,M
距离2026-2027年度旗舰手机的大幕拉开,大约还有四个月时间。按照惯例,届时在全球舞台上率先亮相的主流旗舰,很可能依然是苹果的iPhone 18 Pro系列。 就在昨天(5月8日),知名爆料人Jon Prosser发布了iPhone 18 Pro Max的视频渲染图,与此同时,关于该系列手机的七





