首页 游戏 软件 资讯 排行榜 专题
首页
AI
戴若犁谈机器人数据挑战:CEO亲述行业解决方案

戴若犁谈机器人数据挑战:CEO亲述行业解决方案

热心网友
53
转载
2026-05-16

周六的诺亦腾机器人公司楼下,阳光正好。戴若犁博士——诺亦腾联合创始人,如今也是诺亦腾机器人公司的创始人兼CEO——如约出现,言谈间既有技术人的敏锐,也有创业者的笃定。

聊起十多年前诺亦腾的创立,他依然能清晰地报出iPhone首个陀螺仪芯片的型号:L3G4200D。正是这颗小小的芯片,让他看到了动作捕捉技术民用化的广阔前景。从影视特效到VR交互,再到数字化医疗,诺亦腾的足迹跨越多个领域。如今,当机器人浪潮奔涌而来,他又一次敏锐地捕捉到了产业发展的关键所在:高质量数据。

“2024年全年,机器人业务为诺亦腾带来的营收增长了5倍,2025年又实现了显著增长,两年下来累计增长了近40倍。作为企业管理者,这绝对是一个无法忽视的强烈市场信号。”戴若犁笑道。于是,今年年初,他果断决定将机器人业务拆分,成立一家专注于机器人数据解决方案的公司。谈及这个战略选择,他语气坚定:“我们就是最适合做这件事的团队,诺亦腾机器人也是行业内唯一清楚机器人数据业务该如何系统化运作的公司。”

值得一提的是,戴若犁博士将出席2025年GAIR全球人工智能与机器人大会的数据专场,带来《用动作捕捉技术构建具身智能数据工厂》的主题分享。GAIR大会长期聚焦人工智能的核心技术、前沿趋势与产业落地,本届大会将于2025年12月12-13日在深圳举行。

以下为对话实录,经编辑整理:

01 Noitom Robotics:一家机器人数据公司

问:将机器人业务拆分出来的核心契机是什么?

戴若犁:拆分源于一个明确且迅猛的市场信号。诺亦腾从2014年开始销售产品,客户中一直不乏机器人企业和顶尖研究机构,例如斯坦福、UC Berkeley、东京大学等。但在过去很长一段时间里,机器人用户在整体营收中的占比始终低于5%,在报表上甚至无法单独归类,只能归在“泛科研”里。

真正的转折点出现在2023年下半年。当时,美国两家知名的机器人公司向我们的美国团队提出了一个大规模的采购需求:上百套动作捕捉设备。这个数量在当时看来是“疯狂”甚至“不可能”的,我们一度怀疑其真实性。

然而,从那次“奇怪”的询价开始,市场需求发生了质变。2024年,机器人相关订单总额增长了5-6倍;2025年相比2024年又增长了约6-7倍。两年近40倍的增长,让这件事从“可忽略”变成了“必须战略聚焦”。

我们深入观察后发现,需求的核心逻辑变了。过去,动作捕捉数据以“秒”计,成本高昂;而现在,机器人行业需要的数据是以“小时”、“万条”甚至“十万小时”为单位。需求的“天花板”被彻底捅破了。商业模式也随之涌现出新的可能,不仅仅是卖硬件或服务,还可以构建自有数据集。因此,今年年初我们决定拆分成立新公司,专注于此。

问:诺亦腾机器人公司的融资情况如何?

戴若犁:公司已经完成了累计数亿元的两轮融资,近期会有新的信息公布。

问:公司是面向B端市场的吗?

戴若犁:是的,这是一个非常典型的To B业务。但首先要澄清一点:诺亦腾机器人不是一家机器人数据采集设备公司,也不是单纯的项目服务公司。我们是一家机器人数据解决方案公司,交易的最终界面是数据本身。

我们也会销售设备和提供技术服务,但这更多是为了建立合作生态,服务于未来的数据客户。理想的模式是,我们投入固定资产,直接为客户提供高质量数据,让交割界面变得更轻。我们希望将复杂的环节留在内部,而非与客户的交割面上。

问:目前有做得特别成功的大型数据公司吗?

戴若犁:美国有Scale AI、Mercor和Surge AI这三家代表性公司,各有专长,营收规模在十亿到数十亿美元级别,但在行业外相对低调。国内也有做得不错的公司,例如曼孚,各大厂也都有自己的数据服务业务。

数据本质上是To B业务。在自动驾驶和大模型领域,由于甲方自身拥有强大的原始数据获取能力,数据公司往往更像人力外包(BPO)服务商,利润空间受限于劳动力成本。但在机器人行业,情况不同——甲方往往缺乏高质量、可泛化的数据,这就创造了新的机会和价值空间。

问:你们会对标这些公司吗?

戴若犁:没有直接对标。机器人数据的需求在2023年底才出现,2024年萌芽,2025年刚有起色,预计明年才会进入快速发展期。因此,这个领域还没有成熟的标杆企业。

美国那三家公司在数据处理的“后端”有值得学习的地方,但我们需要先解决“前端”的数据获取问题。因为机器人行业的甲方普遍缺数据,这要求我们必须探索新的路径。

问:与其他机器人数据公司相比,你们的优势是什么?

戴若犁:坦率地说,目前我还没有看到规模或工程积累上值得我们特别关注的竞争对手。市场上存在一些销售采集设备或承接项目的公司,但规模较小。

关键在于,成为一家机器人数据公司,绝不仅仅是拥有设备或能接项目。这中间的差距非常大。数据的复杂度极高,需要保证保真、低成本、大规模高效获取,并且要能让数据跨本体(即跨客户)使用。如果数据只能服务单一客户,那就只是项目公司。

我们的优势在于:第一,拥有成熟的产品交付和复杂项目交付能力。诺亦腾的惯性动捕设备曾占据全球70%以上的市场份额,我们交付过数千万级别、涉及上千人的大型项目,这方面的经验是绝大多数公司不具备的。

Source:Noitom Robotics

第二,也是更重要的,我们是行业内唯一清楚机器人数据业务该如何系统化运作的公司。这个市场足够大,值得“谋定而后动”,想清楚商业模式再行动。如何补短板、增长板,比单纯做事更重要。这也是我们拆分独立融资,并获得优秀投资人支持的原因。

问:创立之初就想好了公司规划?有信心做到行业第一吗?

戴若犁:规划非常清晰。独立融资就是为了把这件事做到极致。对于做到头部,我们很有信心。团队核心成员能力很强:首席科学家曾是腾讯具身模型团队的核心负责人;CFO拥有美股、港股、A股上市及大型公司战投经验;硬件工程负责人来自字节跳动新石实验室。很多人是降薪加入的,大家的目标绝非小事。

问:目标是上市吗?

戴若犁:上市是手段,不是目标。我们的目标是成为具身智能与机器人领域最大的数据提供商。更重要的是,真正为行业解决问题。

我认为在这个细分赛道上,没有人比我更适合解决数据获取与利用的问题。即便是在机器人本体或仿真平台理解更深的美国公司,在数据这个子赛道上,也需要来听听我们的做法。

02 数据工厂只是一块拼图

问:数据主要来自你们的数据工厂吗?

戴若犁:数据来源是多元的。工厂只是其中一种形态。例如,机器人的遥操作数据就更适合在甲方侧生产。我们会采用多种模式获取适合行业的数据。

问:采集数据的操作思路是什么?

戴若犁>当前具身智能与机器人的发展,底层逻辑是仿生学的胜利。无论是模型架构还是本体形态,都在高度模仿人类。因此,思考数据需求时,最不应该做的就是简单的市场调研——因为技术尚未收敛,客户也在探索,需求分散且多变。

我们的思路回归仿生学:从人类执行任务的角度出发,思考需要哪些模态、精度、量程的数据。例如,“拿起咖啡杯打量并喝一口”这个动作,就涉及视觉、触觉、力觉、本体感觉等多种信息输入。确保采集的数据能满足人类执行此类任务的“底线”输入需求,就能大概率保证未来数据在不同本体上的可用性。这就是我们技术路径选择的底层逻辑。

问:你们售卖的是真机数据吗?

戴若犁:我们提供的是“真实数据”,而非“真机数据”。两者有本质区别。真机数据是在特定机器人本体上通过遥操作或强化学习采集的,价值很高,因为它包含了该机器人独有的传感器特性、驱动特性等“本体特异性”信息。

但真机数据最大的问题在于无法跨本体。在宇树G1上采的数据,很难直接用于小鹏或宇树H1机器人,因为硬件构型差异导致数据迁移收益骤降。因此,真机数据不可或缺,但无法通用。我们选择从“人”身上采集真实数据,这正是为了解决跨本体难题。

问:采集主要依赖动作捕捉设备吗?

戴若犁:动作捕捉只是众多数据模态中的一种,主要负责获取人体姿态数据。完整的机器人数据还需要视觉、力触觉、听觉等多模态信息。因此,动捕设备只是数据采集拼图中的一块,而且是为其他行业设计的。为了满足机器人行业更苛刻的需求,我们值得从头打造全套设备与技术栈。

所以我一再强调,我们不是一家设备公司或动捕公司。搞定动捕远不等于搞定机器人数据采集,它只是解决了单一模态采集的基础门槛。要做好机器人数据,动捕公司可能只是整个产业链中的三十分之一。

问:能透露已服务哪些机器人公司吗?

戴若犁:从数量上说,已有六七十家,包括美国十几家,中国四五十家。基本上你听说过的头部公司都与我们有过交易或深度合作,无论是采购设备、服务,还是数据交易与定制。但这属于商业机密。

我们提供的服务涵盖:数据采集设备、系统集成、遥操作链路优化、URDF映射、模仿学习训练数据支持、中小规模数据集授权,以及大规模数据集定制。在这方面,我们的实践经验可能是全球最丰富的之一。

诺亦腾机器人(Noitom Robotics)曾经提供过服务的部分客户案例

问:有没有印象特别深刻的项目?

戴若犁:每个项目对我们都很重要。作为To B服务商,最重要的一点是“嘴严”,认清自己是“配角”的边界。客户信任我们,我们就不应拿合作来炫耀。能说的是,行业内许多引起刷屏讨论的杰出工作,我们都贡献过微薄之力。

Source:西湖机器人(Westlake Robotics)

问:如何看待今年很火的世界模型?

戴若犁:我们在数据预处理、增广、补全等环节都会用到世界模型。公司内部的机器人模型和多模态模型团队,其单点能力可以与多数甲方团队比肩。就像Scale AI的模型团队不逊于Anthropic或OpenAI一样,我们需要具备与客户平等对话、解决复杂问题的能力。

问:世界模型生成的数据能解决机器人数据问题吗?

戴若犁:它会成为真实数据极好的补充。机器人从物理世界或人类行为中学习的信息可分为两类:规则(Rules)和先验知识(Prior)。世界模型或物理引擎能较好地合成与仿真“规则”,但人类那些复杂、难以枚举的“先验知识”很难无中生有。

Source:World Lab

因此,更合理的关系是“增广”或“补全”。例如,基于一个蕴含大量人类先验的1000万小时真实数据集,用世界模型将其泛化到10亿小时。而不是期待构建一个全知全能、能生成一切数据的世界模型——那可能比解决机器人问题本身更难。有趣的是,世界模型本身也可能是真实数据的大买家。上个月我们美国的同事与李飞飞教授的World Labs团队交流,了解到像DeepMind、通义千问多模态这样的团队,对具有空间精度意义的多模态数据有强烈需求。单目视频缺乏空间精度,而世界模型需要双目视觉等多模态信息才能达到更高水平。

问:你们会使用UMI(通用操作接口)吗?

戴若犁:会。UMI是一种非常好的数据采集方式,它在一定程度上可以跨本体,因此我们喜欢UMI数据。

Universal Manipulation Interface(UMI)source: https://umi-gripper.github.io/

但UMI也有明显短板:它丢失了大量全身有价值的信息,且夹爪层面仍与本体绑定,迁移存在差距。因此,UMI数据在短期内验证某些能力或缩放定律时价值极高,成本低、易部署。但从长期看,信息损失太大,不足以作为大规模投入积累的方向。我们会少量涉及,以帮助客户解决实际问题,但它不是我们长期战略的重点。它有点像Sergey Levine所说的“勺叉”(Sporks of AGI),是将军赶路时旁边那只有点肥的“野兔”。

问:可以提前透露一些您在GAIR大会演讲的精彩内容吗?

戴若犁:我会提出一个“具身智能数据金字塔”的概念,分为四层,涵盖遥操作数据、多样化人本数据、互联网数据以及合成仿真数据。

还会分享我们对具身智能数据利用、以及如何解决跨本体问题的思考。是追求一个全知全能的数据集,还是分层解决,亦或是通过企业间的分工合作在不同场景下解决?我们形成了一些持续迭代的认知,希望届时能与大家分享最新的思考。

此外,也会简要介绍我们与一些杰出伙伴的合作,展示一些有趣的视频成果。相信能给大家带来一些有价值的认知和启发。

来源:https://www.leiphone.com/category/ai/CG9rgWqSBQ3EDMmq.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

人工智能技术赋能中国市场,产业应用迎来新机遇
AI
人工智能技术赋能中国市场,产业应用迎来新机遇

人工智能技术正为中国市场开启新的发展窗口。业界观点指出,AI在产业应用层面带来了切实机遇,其与制造业、医疗、金融等领域的融合不断深化。技术迭代与算力发展正推动传统行业数字化转型,而构建健康的技术生态与人才培养体系,将是把握这一机遇、实现可持续发展的关键。未来,人工智能有望在更广泛的场景中创造价值。

热心网友
05.15
数字孪生产教融合头部企业竞争力与核心方案解析
AI
数字孪生产教融合头部企业竞争力与核心方案解析

数字孪生技术作为驱动数字经济高质量发展的核心引擎,其应用版图正从智慧城市、智慧水利加速拓展至能源电力、交通运维、智慧仓储等关键领域。产业落地进程持续提速,市场规模年复合增长率超过30%——在这蓬勃发展的浪潮之下,一个严峻的现实挑战也浮出水面:行业专业人才缺口已超过百万大关。 特别是那些既精通三维可视

热心网友
05.15
中芯国际赵海军展望全年运营 对今年业绩持乐观态度
AI
中芯国际赵海军展望全年运营 对今年业绩持乐观态度

在刚刚结束的一季报业绩说明会上,中芯国际联合CEO赵海军向市场传递了明确的乐观信号。基于当前清晰的客户需求与在手订单状况,公司对今年整体运营情况的展望,较上一季度显得更为积极。 这份乐观并非空xue来风,其背后是多重动能的强劲支撑。首要驱动力,无疑是人工智能浪潮对配套芯片的强劲需求,直接导致了公司电

热心网友
05.15
直播机器人连续工作超30小时稳定性实测
AI
直播机器人连续工作超30小时稳定性实测

机器人连续运行超过30小时无需停机——这并非科幻情节,而是正在直播中真实呈现的工业自动化突破。 据《科创板日报》15日报道,Figure公司创始人布雷特·阿德科克正式宣布,其最新一代F 03机器人已在公开直播环境下,实现了超过30小时的不间断作业。尤为关键的是,在整个运行周期内,系统未发生任何计划外

热心网友
05.15
百度成立模型委员会BMC 强化AI技术领先地位
AI
百度成立模型委员会BMC 强化AI技术领先地位

据《科创板日报》独家披露,百度近期对其人工智能业务的组织架构进行了一次重要升级,核心举措是成立了全新的“百度模型委员会”(Baidu Model Committee,简称BMC)。 据悉,该委员会成员以对AI大模型技术有深刻理解和前瞻视野的年轻研究员为主。在组织架构上,百度的基础模型研发部(BMU)

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Mac预览编辑图片尺寸教程 苹果自带工具调整大小
系统平台
Mac预览编辑图片尺寸教程 苹果自带工具调整大小

Mac自带的“预览”应用可便捷调整图片尺寸。通过“调整大小”工具精确修改像素,勾选“比例缩放”避免变形。使用“裁剪”工具框选区域以改变有效显示尺寸。利用“导出”功能可生成指定尺寸的副本而不影响原图。

热心网友
05.16
NASA与Microchip合作研发抗辐射航天芯片技术
科技数码
NASA与Microchip合作研发抗辐射航天芯片技术

航天计算技术正迎来一次里程碑式的升级。美国国家航空航天局(NASA)近日联合美国微芯科技公司(Microchip),正式启动了名为“高性能航天计算”的研发项目。该项目的核心目标,是研制一款片上系统(SoC),其运算性能预计将达到当前航天专用处理器的百倍以上。 根据NASA的规划,这款高性能航天芯片将

热心网友
05.16
银河麒麟系统开启Vulkan加速提升游戏性能教程
系统平台
银河麒麟系统开启Vulkan加速提升游戏性能教程

在银河麒麟系统上,若游戏或图形应用出现卡顿、帧率低或崩溃,可能是未开启Vulkan硬件加速。针对不同显卡,可采取相应方法启用。对于AMD或Intel集成显卡,可通过终端安装并验证mesa-vulkan-drivers包;对于已安装NVIDIA专有驱动的用户,需确保系统正确加载VulkanICD文件。操作主要适用于银河麒麟桌面操作系统V10及后续版本。

热心网友
05.16
银河麒麟系统安装Julia语言教程 打造高性能数值计算环境
系统平台
银河麒麟系统安装Julia语言教程 打造高性能数值计算环境

在银河麒麟操作系统上构建高效数值计算与数据分析平台,Julia语言凭借其脚本语言的易用性与编译语言的高性能,成为科学计算领域的理想选择。若您已完成麒麟系统的基础配置,但发现Julia环境尚未就绪,这通常是由于系统未预装或缺少关键依赖库所致。本文将系统梳理在银河麒麟OS上安装Julia语言的几种主流方

热心网友
05.16
Mac多显示器排列与分屏设置详细教程
系统平台
Mac多显示器排列与分屏设置详细教程

Mac连接多显示器后,需在系统设置的“显示器”选项中调整逻辑排列以匹配物理布局。拖动屏幕缩略图对齐实际位置,关闭“镜像显示器”以启用独立排列与分屏功能。可设定主显示器并进行微调,通过快捷键或拖拽窗口实现流畅分屏操作。

热心网友
05.16