三星布局大模型从基础模型迈向物理人工智能_AI热点日报

三星布局大模型从基础模型迈向物理人工智能

类型：热点整理2026-05-27

过去几年，大模型领域的竞争，似乎一直是几家头部AI公司之间的游戏。但随着技术浪潮从数字世界涌向真实的物理设备，竞争的底层逻辑正在悄然改变。最近，一个长期相对低调、却坐拥全球最大消费电子生态之一的科技巨头，正以惊人的速度切入大模型的核心战场——三星（Samsung）。更重要的是，它选择的路径，与大

过去几年，大模型领域的竞争，似乎一直是几家头部AI公司之间的游戏。但随着技术浪潮从数字世界涌向真实的物理设备，竞争的底层逻辑正在悄然改变。

从Foundation Model到Physical AI，三星「杀入」大模型核心战场

最近，一个长期相对低调、却坐拥全球最大消费电子生态之一的科技巨头，正以惊人的速度切入大模型的核心战场——三星（Samsung）。

更重要的是，它选择的路径，与大多数互联网公司截然不同。

近期，三星连续发布了多篇重量级研究，覆盖模型架构、强化学习、物理智能（Physical AI）等多个前沿方向。这一系列动作背后，传递出一个非常清晰的信号：三星正在全面构建自己的基础模型（Foundation Model）体系。

与此同时，据此前媒体报道，三星已采购数万张GPU用于AI基础设施建设。随着HBM等高带宽内存在AI训练中的需求持续爆发，三星在AI基础设施领域的传统优势，也正被重新审视和激活。

相比多数互联网公司，三星还有一个更为独特的优势：它不仅拥有模型研发能力，更拥有全球最完整的软硬件生态之一。从智能手机、智能家居到机器人设备，三星几乎覆盖了用户日常生活的所有核心场景。当AI从“聊天助手”阶段迈向“真实世界交互”阶段时，这种端到端的生态能力，其战略价值正在急剧攀升。

架构革新：用“记忆”突破端侧算力瓶颈

三星近期一项备受关注的工作，是其提出的基于记忆的大模型新架构Meki。这项研究试图在资源受限的条件下，重新定义模型规模扩展（Scaling）的方式。

过去几年，大模型的发展遵循着一条相对直接的路径：更大的参数量、更多的训练数据、更强的算力。然而，当AI开始进入真实的移动设备和物理世界后，这条路径遇到了明显的天花板。无论是手机、智能家居还是机器人，端侧设备的运行内存（RAM）、带宽和功耗都极其有限。传统的Transformer架构通常要求海量参数常驻内存，这使得模型规模在端侧几乎无法持续扩大。

但这里存在一个有趣的矛盾：这些设备的存储空间（ROM）往往远大于其运行内存。于是，三星的研究人员提出了一个新思路：能否利用充裕的ROM，来进一步扩展模型的能力边界？

Meki架构的核心，在于引入了一个参数化的“记忆银&行”（Memory Bank）。它将大量的知识存储在ROM中，仅在推理需要时动态读取到RAM进行计算。简单来说，这套方案实现了“RAM管实时计算，ROM管知识存储”，从而让模型能力得以突破端侧硬件的物理容量限制。

相比传统架构，这种设计显然更适合需要长期在线、实时交互的端侧AI与Physical AI场景。尤其是在机器人等系统中，模型不仅面临严苛的资源约束，还必须满足低延迟、实时响应和7x24小时稳定运行的要求。因此，这类面向端侧资源约束的架构创新，其重要性正日益凸显。

训练范式演进：从静态模型到交互式智能系统

除了模型架构，三星近期提出的M2RL（Multi-Domain RL）研究，则深入探索了多领域强化学习的训练范式。

随着AI开始与真实设备和现实世界互动，仅靠静态的文本数据训练已经越来越不够用。模型需要持续与环境交互，需要感知设备状态，需要学习执行长链条任务，更需要适应动态变化的世界。下一代基础模型，正从“静态的语言模型”向“交互式的智能系统”演进。

在此背景下，M2RL系统性地研究了不同领域强化学习能力之间如何协同演化，涵盖了混合多任务RL、模型融合、多阶段后训练等多个方向。研究发现，数学、代码、科学推理等高密度推理任务之间，不仅不存在明显冲突，反而能够产生协同增强效应。这意味着，强化学习正在成为推动基础模型获得更强推理、规划及复杂环境交互能力的关键引擎。

评测体系重构：为物理世界智能设立新标尺

此外，三星也开始布局面向物理世界智能的评测体系。其提出的LiveClawBench，旨在解决一个行业日益凸显的痛点：当AI真正进入设备、机器人与Physical AI场景后，传统的评测基准（Benchmark）已越来越难以有效评估下一代模型的能力。

过去的大模型评测，大多基于静态任务、固定环境和标准答案。但真实世界中的AI系统并非如此运作。现实环境里，设备状态瞬息万变，任务链路更长，环境复杂度也更高，模型需要持续进行感知、规划、执行与调整。对于真正要在现实世界中运行的AI系统而言，仅靠“刷题式”的评测是远远不够的。

为此，LiveClawBench提出了一个“三维复杂度框架”，从环境复杂度、认知需求度和运行时适应能力三个维度，系统性地评估模型在真实复杂环境中执行长期任务的能力。相比传统的智能体（Agent）评测基准，LiveClawBench更强调真实的任务链路、多环境协同以及复杂的长期任务。从某种意义上说，它探索的正是这样一个根本问题：当AI真正融入物理世界后，我们该如何评价下一代智能系统？

战略核心：背后的组织与人才引擎

这一系列前沿工作的背后，都指向三星一个新组建的核心技术攻坚组织——AI Model TF（Task Force）。

在三星的体系内，TF（特别任务组）是面向公司级战略任务设立的核心攻坚组织，通常承担着决定未来核心竞争力的关键技术方向。而AI Model TF，正是三星在2025年由集团CTO直接推动成立的大模型团队。其核心定位是面向三星全球业务体系，打造先进的基础模型能力，并以此为根基，向物理智能方向演进。

在行业观察者看来，这释放出一个明确的信号：三星正在以前所未有的战略力度，加速投入下一代AI能力建设，并将其提升至集团核心战略的高度。

相比传统的互联网公司，三星不仅具备模型研发能力，更同时拥有覆盖手机、家居、机器人，乃至底层芯片与AI基础设施的全球最完整终端生态。这使其天然具备了将大模型无缝落地到真实物理世界与用户场景中的独特优势。

随着大规模GPU集群与AI基础设施的持续投入，AI Model TF正在快速汇聚基础模型、强化学习等方向的核心人才。它已被外界视为三星下一代AI战略最关键的技术组织之一，承载着在基础模型、Physical AI等未来智能体系上实现核心突破的任务。

值得注意的是，近期这些重要研究的通讯作者，均为AI Model TF的负责人、三星高级技术总监唐业辉。据了解，他目前主要负责三星大模型的训练与核心技术方向推进，长期深耕基础模型与Physical AI领域，在超大规模模型训练、模型架构与系统优化等方面拥有深厚积累。其研究重点涵盖高效模型、智能体（Agentic AI）、世界模型（World Model）等前沿方向，并拥有基于万卡集群开展超大规模模型训练的丰富经验。

从三星近期在基础模型、端侧智能与Physical AI等领域取得的连续突破来看，这与其快速搭建的高水平AI人才体系密切相关。公开资料显示，唐业辉博士毕业于北京大学，其Google Scholar学术引用超过1.3万次，并长期担任NeurIPS、ICML等国际顶级AI会议的领域主席。

来源：https://www.jiqizhixin.com/api/article_library/articles/2026-05-27-3

Physical

延伸阅读

补充最近整理过的热点入口。