过去十年间,人工智能在阅读和写作这两项核心能力上取得了显著进展。大语言模型不仅能解析复杂语义,还能生成高质量文本,表面上显得十分“聪明”。然而,一旦将这些模型部署到真实的物理世界中——例如让机器人拿起杯子、推开房门,或在一个陌生环境中自主行动——缺陷便立刻暴露:它们既缺乏空间感知能力,也无法执行具体动作。
这恰恰揭示了当前人工智能的深层边界。语言智能主要解决了“知道”的问题,而现实世界真正渴求的是“做到”。从这一视角来看,AI的下一个进化方向并非追求更强的对话能力,而是转向具身智能(Embodied AI)。有趣的是,在这一演进路径上,一个原本扎根于计算机图形学的技术——3D Gaussian Splatting(3DGS)——正逐渐成为关键的支撑点。
3DGS:远不止更快的NeRF
许多人首次接触3DGS时,往往会将其视为“NeRF的加速版本”。这种认识虽不能说完全错误,但远未触及本质。传统三维表示方法长期面临一个经典困境:Mesh或点云结构明确,但表达能力受限;NeRF表达能力强,却推理速度极慢。3DGS的真正价值在于——它彻底打破了这种二选一的僵局。通过一组带有空间分布的高斯体表示场景,系统既获得了显式结构,又保留了连续表达能力,同时还能实现实时渲染。
而更关键的是,3DGS带来了一个全新的可能性。如前所述,这项技术正从“单场景表示”迈向“世界级系统”。这句概括背后,折射出整个技术方向的根本转折。
关键转变:从渲染工具到“空间系统”
传统三维技术大多采用离线工作流:建模、渲染、输出结果,属于典型的“工具链”。而如今,这些系统正逐渐演化为“运行时系统”:场景可像视频流一样按需加载,数据能跨设备访问,渲染复杂度与场景规模逐步解耦。这意味着什么?简言之,一旦三维数据变成“在线系统”,它便不再仅用于观看,而是能够参与计算、推理乃至决策。这一步,正是3DGS能够真正突破原有领域的原因。

AI的三大核心能力:认知、空间与行动
将问题进一步抽象,当前人工智能的核心方向可以概括为一句话——将“知道”转化为“做到”。这一目标对应着三种关键能力:
1. 认知(Cognition)
由多模态大模型(如GPT-4V、LLaVA)承担。它负责理解用户指令、任务定义及目标意图。但它的明显短板在于:对世界的真实物理结构缺乏认知。
2. 空间(Spatial Representation)
这正是3DGS的用武之地。它提供的核心信息包括:物体所在位置、外观形态以及与其他物体的空间关系。本质上,3DGS正演变为一种“可查询的三维数据库”——用户可以对三维世界进行查询、操作甚至实时更新。
3. 行动(Action)
这层往往最容易被忽视,却恰恰最为关键。传统方法依赖控制算法或强化学习,而如今越来越多的研究采用生成模型(特别是Flow/Diffusion)来生成动作轨迹。与扩散模型相比,Flow Matching在推理速度上更快、延迟更低,因此更适合实时控制场景。
一个完整闭环:AI如何真正“做事”
当这三块拼图拼接在一起,便形成一个极为清晰的结构:
用户指令 ↓
多模态 LLM(理解任务) ↓
3DGS(获取空间信息) ↓
Flow 模型(生成动作) ↓
执行 ↓
反馈 → 再次更新
这一结构的关键不在于每一层单独有多强,而在于它构建了一个完整的闭环。过去的AI大多遵循“输入→输出”模式,而这里则是“输入→行动→反馈→再决策”,这正是智能系统的本质所在。
3DGS为何不可或缺,而非可选项
你可以将整个系统想象为三层架构:LLM相当于大脑,Flow模型如同肌肉,而3DGS则扮演着眼睛和空间记忆的角色。没有LLM,系统便失去目标;没有Flow,系统无法执行动作;但如果没有3DGS,系统甚至无法感知世界的样子。这也解释了为什么许多“表面强大”的AI在现实环境中表现糟糕——它们缺失的正是空间层。3DGS的意义在于:它正成为人工智能与现实世界之间的关键接口。
工程现实:理想很美,落地很难
谈到这里,很容易让人产生一种错觉:技术路线已经非常清晰,剩下的只是工程实现。然而现实恰恰相反。当前面临的最大问题主要有三个:
1. 技术门槛极高
涉及多视图几何、神经渲染、优化算法等多个领域,绝非简单调用现成库就能解决。
2. 工程链路很长
典型流程包括:数据采集→SfM→MVS→NeRF→3DGS。每个环节都暗藏陷阱,且许多属于难以预料的“隐性坑”。

3. 性能优化困难
GPU显存限制、数据调度问题以及实时性要求,使得许多项目虽然能够运行却难以实用;即便可用,也缺乏可扩展性。
总结
如果要用一句话总结这条技术路线:人工智能正在从“理解语言”迈向“理解世界”。这条路径的核心结构已经清晰:大模型负责理解,3DGS负责建立世界模型,Flow模型负责执行动作。其中,3DGS是最容易被低估的一环,但它很可能成为一切的基础。如果你正从事三维重建、机器人、自动驾驶或扩展现实(XR)相关工作——这个方向几乎可以确定,并非短期热点,而是长期发展趋势。
