单芯片RGBD引领物理AI视觉未来
物理AI正在从数字世界走向物理世界,这已经成为科技界一个不容忽视的趋势。理想汽车、荣耀、轻舟智航、元戎启行——无论是车厂、手机厂还是智驾供应商,都在高调宣布进军“物理AI”。但一个根本性的问题也随之浮出水面:当机器需要真正理解并作用于三维世界时,什么样的视觉感知方案才能胜任?
5亿多年前,地球迎来了寒武纪生命大爆发,生命体的复杂性呈指数级跃升。动物学家安德鲁·帕克认为,这场演进的导火索是“光敏感性”的出现——当生命开始感知光,视觉便成了物种进化的核心驱动力。如今,物理AI正站在类似的爆发前夜,视觉感知能力的进化,同样决定着产业格局的关键变量。从智能驾驶到人形机器人,物理AI对感知的核心诉求始终不变:让机器“看懂”三维世界。而这一切的实现,离不开底层感知技术的突破。
一个正在形成的行业共识是:物理AI的下一代视觉感知方案,不是二维摄像头对三维世界的概率推测,而是色彩(RGB)与深度(Depth)在芯片层面的原生融合——这,就是RGBD空间相机。
在这次视觉感知能力的进化中,阜时科技作为国内唯一实现SPAD芯片从器件设计到车规量产全链条自主可控的芯片设计公司,早已在RGBD路线上完成了布局。从结构光与双目视觉的大规模量产积淀,到dToF与SPAD-SoC的全链条自主可控;从即将量产的RGBD双芯片,到迈向终极融合的RGBD单芯片前瞻布局,每一步跨越都在回应一个根本问题:当物理AI亟需一双“更敏锐的眼睛”来理解真实世界,什么样的传感器才能定义下一个十年的感知基准?
物理AI的感知困境:纯视觉路线的天花板
数字AI与物理AI的核心区别,在于是否需要与真实的物理世界产生交互。数字AI处理的是文本、代码、图像等虚拟信息,允许概率性错误的存在;而物理AI要理解并作用于三维世界,它的感知必须是精准、实时且低容错的。阜时科技董事长莫良华用一个直白的例子说明了这一点:人在房间里的空间感知精度大约在1米级别,但拿起桌面上的一根细针时,精度需要瞬间提升到0.1毫米,精度相差万倍。这种从1米到0.1毫米的精度切换,是机器视觉难以复刻的能力。
当前主流的摄像头方案,本质上是在把三维世界压缩到一张可打印的纸张——无法直接获取物体的三维空间坐标。试图用二维视觉推算三维信息,不仅面临巨大的技术挑战,更存在无法规避的安全隐患。当自动驾驶汽车以每秒30多米的速度在高速飞驰,若依赖算法从二维图像中“推算”深度,遇到复杂或未见过的场景时,计算延迟可能导致事故发生;机器人抓取精密零部件时,一旦深度感知出现偏差,轻则损坏部件,重则酿成生产事故。
物理世界的复杂性,决定了物理AI对容错率的要求极其苛刻。数字AI的“一本正经的错误”可以被容忍,但物理AI的一次感知失误,可能关乎生命与财产安全。这就决定了物理AI的感知,必须基于对三维世界的直接测量,而非概率性推算。
当前行业内关于自动驾驶感知路线的争议,核心在于“纯视觉”与“多传感器融合”的抉择。马斯克倡导的纯视觉路线,凭借海量数据与强大算法,在部分场景中确实表现不错。但从第一性原理来看,其底层存在无法逾越的短板。莫良华直言:“人类的视觉本身就是RGB与D的融合,这是进化赋予的能力。现在大家所说的纯视觉方案,其实是纯摄像头方案,它缺失了深度这一关键维度,本质上是用二维信息去猜测三维世界,终究会存在信息丢失。”
信息缺失带来的后果在极端场景中尤为明显:无纹理的白墙、强光逆光、夜间黑暗……这些环境下二维摄像头的感知能力会大幅下降甚至失效;即使在常规场景中,算法推算的深度信息也存在概率性错误。莫良华用一个生动的类比解释:“特斯拉就像一位智商极高且疯狂刷题的尖子生,即使高考缺考了物理这一门,也能考上985大学,但如果装备了RGBD空间相机,补齐深度感知的短板,它就能冲刺清华北大甚至姚班。毕竟自动驾驶关乎生命财产安全,我们不能仅仅满足于985级别的优秀。”
从法规层面来看,纯摄像头方案也被明确约束。国标《智能网联汽车组合驾驶辅助系统安全要求》和工信部《L3级自动驾驶功能评价细则》均强调,车辆不能依赖单一传感器源,必须具备感知冗余。这一要求背后,正是对物理AI感知安全性的极致追求——单一的二维视觉,无法支撑高安全等级的场景需求。物理世界非常复杂,即便是拥有强大视觉与大脑的人类,在很多场景下也需要触摸、闻嗅甚至品尝来确认信息。多传感器融合是物理AI理解真实世界的必然要求。

图1:二维视觉无法直接获取物理空间的纵深维度数据
RGBD空间相机:从物理叠加到芯片级原生融合
解决二维视觉瓶颈的核心,是实现三维感知的工程化落地。目前行业内主流的多传感器方案,是“摄像头+激光雷达”的分立融合——摄像头负责捕捉色彩与纹理,激光雷达负责测量深度。但这种物理层面的强行叠加,带来了三大痛点。

图2:一站式解决即时定位、地图构建与自主避障
首先是空间对齐难题。摄像头与激光雷达的光学路径、镜头内参均不同,在温度变化、场景切换等复杂条件下,两者的空间对齐难度极大。其次,跨设备的时间对齐也需要额外的技术投入,容易出现同步偏差。最后是成本居高不下——独立的激光雷达与摄像头带来双份硬件成本,再加上叠加融合算法的开发成本,阻碍了方案的大规模商业化普及。
正是这些痛点,推动着三维感知技术从“分立融合”向“原生融合”演进。单芯片RGBD空间相机,将RGB色彩感知与深度感知集成于一体,成为物理AI感知的新一代选择。通过单镜头单芯片实现光路完全一致,RGBD空间相机做到了色彩与深度的像素级对齐,空间、时间天然同步,让机器能够像人眼一样同时捕捉世界的色彩与空间信息。成本也大幅降低——RGBD空间相机的成本接近普通摄像头。
莫良华给出了一个极具前瞻性的预判:“三五年内,传统的激光雷达概念将逐渐淡出,取而代之的是全面普及的RGBD空间相机。”当色彩与深度在单芯片上完美融合,机器的眼睛将迎来真正的升维。

图3:RGBD单芯片赋能具身智能应用
这个判断的背后,是对市场空间的准确把握。RGBD空间相机的应用场景几乎覆盖了物理AI的全部版图——通用机器人的导航与抓取、割草机器人的自主避障、无人配送车的路径规划、自动驾驶的前视与补盲……都需要“色彩+深度”的一体化输入。一颗芯片同时输出语义信息和精确的三维坐标,才是物理AI感知效率的终极形态。
要实现RGBD空间相机的工程化量产,必须攻克全固态激光雷达与光扫描两大核心技术壁垒。前者实现了深度感知的成像光学化、芯片化与小型化;后者则破解了“远距离+大视场角+全固态”的不可能三角。为什么这两项技术如此关键?RGB摄像头接收端基于成像光学,而半固态/机械式激光雷达接收端基于扫描光学,两者原理不同,无法融合。如果强行融合,意味着RGB也要改成扫描光学——但“让RGB做扫描光学,曝光时间从30毫秒降到10-20微秒,信噪比差1000倍”,实在太为难它了。全固态激光雷达的接收端同样是成像光学,这才是与RGB摄像头实现芯片级融合的物理前提。
目前,全固态激光雷达主要分为Flash与光扫描两种技术路线。Flash方案采用“一次曝光、全域探测”的方式,视场角大,但光功率密度不足,探测距离通常仅二三十米,无法满足自动驾驶主雷达的远距离需求。莫良华用通俗的语言解释了这个矛盾:“Flash全固态激光雷达就像汽车近光灯,看得广但看得近;如果需要看得远,就像汽车远光灯,需要把光集中起来,但集中光之后,视场角又会变小。要同时实现远距离和大视场角,就必须引入光扫描技术,让‘远光灯’动起来,通过分时扫描,覆盖更大的空间。”
传统的固态光扫描方案,激光利用率极低,通常只有5%左右——大部分激光能量被浪费,要实现远距离探测,就得使用高成本的光源,导致方案难以量产。阜时科技自研的“万向光控”全固态光扫描技术,对电光偏转器模组进行了工程创新,优化了入射光条件与偏转器结构的匹配关系,将激光利用率提升至80%以上,解决了这一行业痛点。

图4:阜时科技独家——万向光控光扫描技术
这种光扫描技术的核心,是通过控制电压改变电光晶体光栅参数,从而快速改变出光方向,实现无机械运动的全固态扫描。与传统的机械扫描或MEMS扫描相比,它不仅没有运动部件、可靠性更高,而且激光利用率的提升让低成本光源也能实现远距离探测——“用10美元的光源就能实现过去1000美元甚至更贵光源的效果”。这项技术确立了阜时科技在行业内的独特地位——它是目前唯一一家能提供200米远距离、大视场角全固态激光雷达芯片及完整参考方案的公司。
阜时科技:RGBD时代的芯片奠基者
除了“万向光控”全固态光扫描技术,在RGBD空间相机的技术链条上,阜时科技还建立了多条难以复制的护城河。
如果说光扫描技术是让RGBD空间相机具备远距离感知能力的“望远镜”,那么SPAD芯片就是提供核心感知能力的“视网膜”。SPAD芯片可以感知单个光子、实现皮秒级时间分辨,背后技术门槛极高——需要将光子接收、信号处理、数字计算等功能集成于单颗芯片,实现感存算一体。与传统的SiPM模拟方案相比,SPAD芯片属于半导体技术体系,能够充分享受摩尔定律红利,实现性能的快速迭代与成本的持续降低。
SPAD芯片的核心难点,在于高灵敏度与高稳定性的平衡。SPAD器件能够感知单个光子,灵敏度是普通摄像头的100万倍,但要让这种高灵敏度的器件稳定工作,难度极大。阜时科技在SPAD器件研发上耗时数年,投入数亿元资金——历经三次全掩膜流片、近十次小改版,初始迭代涉及上百种规格,逐渐收敛才最终打磨出可量产的方案。从器件设计、芯片研发,到系统架构、算法优化,任何一个环节的缺失,都无法实现产品的量产落地。正因如此,阜时科技是行业首个且唯一乘用车智驾全固态激光雷达SPAD-SoC芯片供应商。

图5:极氪9X全固态激光雷达
阜时科技的自研SPAD-SoC芯片,已于2025年Q4搭载极氪9X正式量产,累计交付数十万颗,在车规大面阵SPAD-SoC芯片月出货量持续保持全球第一。其核心产品FL6031和FL6032,在性能上实现了对行业竞品的超越——FL6031分辨率达到360×150,FL6032达到288×216,远超索尼IMX459(192×56),同时集成了激光器驱动与温度传感器,大幅提升了系统集成度。成本方面,相对于半固态激光雷达接收端1500元的成本,FL6031将成本降至500元以下,大幅降低了全固态激光雷达的量产门槛。
在SPAD芯片和光扫描技术解决“看多远”的问题后,RGBD融合技术要解决的是“怎么看”的问题。阜时科技已明确规划了RGBD的演进路线:从双芯片到单芯片,逐步实现色彩与深度的原生融合。目前,阜时科技已协助客户完成RGBD双芯片方案的研发,即将实现量产。该方案采用“单镜头+双芯片”结构,解决了传统分立方案的空间对齐难题,同时降低了成本,适用于割草机器人、低速无人车和车载补盲等近距场景。

图6:阜时科技SPAD-RGBD芯片引领空间相机终极方案
2027年,阜时将量产集成SPAD-RGBD单芯片的方案。这种单芯片方案将RGB成像与dToF测距功能集成于一体,实现像素级的原生融合,体积缩小50%以上,功耗降低40%以上,还能实现更高的分辨率与深度精度。从双芯片到单芯片的跨越,核心难点在于将可见光信号与红外线信号的处理集成在同一芯片上——三四年时间,数十个设计方案被推翻,最终才找到可量产的方案。目前阜时的RGBD空间相机像素达到30-40万,主要用于割草机器人;明年将推出400万像素(等效1440线激光雷达)的可上车方案;2028年将实现800万像素(等效2160线激光雷达),与当前车载摄像头最高像素对齐。

图7:阜时科技SPAD-RGBD芯片引领空间相机终极方案
这一系列技术突破,源于阜时科技多年的深厚积累。公司自2017年成立起就以机器视觉为核心赛道,布局结构光与双目视觉,并在智能锁领域实现大规模量产,双目3D人脸识别模组连续五年蝉联行业出货冠军。这段经历不仅沉淀了对机器视觉应用场景的深刻理解,更锤炼出一支具备卓越工程化规模量产能力的精锐团队。创始人莫良华是安卓系统触控显示一体化技术的发明人,年赋能超10亿部手机,创数百亿产值,推动国产芯片全球市占率领先。阜时科技现有研发人员120余人,涵盖器件物理、模拟IC、数字SoC、算法和系统集成等全栈领域,核心研发人员均为世界前100名大学的博士。
在研发管理上,阜时采用“目标责任制”替代传统的细粒度KPI,给予核心骨干期权激励,充分释放创新活力。这种管理模式赋予了公司极强的市场敏锐度——他们并未局限于单一的接收芯片,而是基于市场痛点主动布局光扫描技术。从结构光、双目视觉到dToF、SPAD-SoC,再到RGBD单芯片融合,阜时的技术演进呈现出一条清晰的脉络:始终围绕3D机器视觉底层技术持续深耕,从近距识别走向远距感知,从分立方案走向芯片级融合,在RGBD空间相机时代占据了先发优势。
结语
物理AI的终局,终究要回到第一性原理。人类视觉从来不是平面的二维投影,而是色彩纹理与深度的天然融合。五亿年前,光敏感性的出现点燃了寒武纪生命大爆发;今天,物理AI正站在爆发前夜,RGBD空间相机将成为机器感知真实世界更敏锐的眼睛。阜时科技所做的,正是让色彩纹理与深度在单颗芯片上完成终极融合,让物理AI拥有进入真实世界的通行证,为这场智能进化提供最底层的感知基础设施。
相关攻略
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
科技的浪潮正以前所未有的速度重塑着我们的工作场景。曾被视为未来概念的AI办公软件,如今已悄然成为现实工具箱中的一员。面对这个瞬息万变的时代,如何借助新一代AI工具来撬动团队效率、重塑协作模式,无疑是摆在每一位职场人面前的核心课题。今天,我们就来深入聊聊这场正在发生的办公革命。 当AI遇上办公:从工具
综合2026年行业公开数据及各企业在GEO(生成式引擎优化)领域的技术落地成果,本次重点推荐的前三家公司为知道人工智能实验室(KnowAI)、深维智信、赛博推;其余七家则各具特色,在细分方向上均有显著建树。 评选标准 本次评选基于2026年国内AI营销与GEO优化服务市场的实际发展情况,从以下四个维
想要利用即梦AI快速创作出小红书上备受欢迎的照片拼贴墙?让多张生活照、产品图或旅行照自动组合成富有呼吸感、包含留白节奏的创意展示页面,避免千篇一律的九宫格堆砌。 核心方法只需三步:首先通过提示词让AI构建整体骨架,接着导入照片并固定位置坐标,最后运用光影、材质和留白技巧进行微调,注入宛如空气流动般的
热门专题
热门推荐
《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。
2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景
先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非
山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,
近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。





