游乐游手机版
首页/科技数码/文章详情

智源押注世界模型,开启AI下一场革命

时间:2026-06-12 12:50
智源研究院转向世界模型研究,认为世界模型应预测下一个物理状态而非视频生成。当前该领域处于早期,类似2012年的大语言模型,数据获取仍是核心难题。团队由青年科学家主导,探索长期技术突破。

说起国内AI早期发展,有个名字一定绕不开——北京智源研究院。早在2024年3月,智源发布的悟道1.0就开启了中国的大模型时代,后续孵化的杨植麟、唐杰等人,也都是如今大模型圈的中坚力量。也正因此,智源一度被视作国内大模型的“黄埔军校”。

但到了2026年,这家研究院却悄然换了方向——大语言模型不再是主攻对象。理由很简单:作为新型研发机构,智源专攻的是高校、企业不愿意碰的AI前沿方向。智源研究院院长王仲远坦言,智源的目标始终是在AI最前沿探索——而在他看来,当前最前沿的领域,叫做“世界模型”。

6月11日,新京报贝壳财经记者随“活力中国调研行”走访智源研究院,深入了解了这一前沿领域的最新进展。智源也是国内最早倡导世界模型的科研机构。

世界模型不是3D生成,而是“预测下一个物理状态”

市面上已经有不少宣称“世界模型”的产品。比如用户上传一张图片,模型就能生成一个可探索的3D世界,看起来更像是视频生成或游戏引擎。但在王仲远看来,这些和真正的世界模型还差得远。

“现在业内普遍把视频生成模型称作世界模型,源头是OpenAI发布Sora时用了‘世界模拟器(World Simulator)’的说法,这个叫法原本只是形容视频生成。如今热门的视觉—语言—动作模型(VLA)、世界动作模型(World Action Model),只是把画面视频和动作数据拼在一起。目前来看,大家都在叫的世界模型都不是真正意义上的世界模型。”

那么究竟什么才算世界模型?行业内众说纷纭。6月初,李飞飞就发长文试图下定义。而王仲远的解释更直白:如果说大语言模型预测的是“下一个Token”,那么世界模型预测的应该是“下一个物理状态”。

“你看到的3D世界生成,更多应用于虚拟世界,很多游戏已经拥有非常逼真的模型、光线和物理引擎。但仿真引擎有它的上限。我们所希望的世界模型,是大模型驱动的,只要数据量足够,它就能超越人类经验构建出来的引擎。从潜力上看,就像现在大语言模型用于科学发现一样,世界引擎也可以帮助我们发现新的规律。作为未来的世界基座模型,它的理论上限空间更大。”

王仲远进一步透露,智源在大模型领域的布局其实早有规划。“早在语言大模型时代,我们发布了悟道1.0、2.0和3.0,孵化出智谱、面壁这些主流大模型公司。2024年,智源开始涉及世界模型,2025年发布emu3和emu3.5多模态世界模型,2026年又推出了physis和orca,一直在持续探索前沿。”

他强调,智源并不是在跟风,而是按照既定的战略方向稳步推进——大语言模型在两年之前已经完成探索,交给智谱、面壁这些企业去做;现在开始重点布局世界模型,因为这是下一个十年的主战场。

他的理念是:技术先行,早于产品,早于系统。“就像深度学习是2006年提出的理念和解决方案,Transformer是2017年提出的,而大语言模型直到2024年底才爆发。因此,现在就需要对技术路径进行各种各样的探索,才能引领和促进世界模型的爆发。”在大语言模型时代,智源是跟随者;到了多模态时代,智源已经开始提出自己独立的技术路径。从世界模型开始,智源有了对这个问题自己的定义,技术路线上也有自己的信仰。某种程度上,这也证明了中国人工智能力量在努力探索前沿方向,希望能够最终引领。

世界模型仍处于初级阶段,“就像2012年的大语言模型”

尽管对世界模型的未来充满信心,王仲远也毫不讳言当前的现实处境——世界模型还太嫩了。“必须承认,物理AI特别是世界基座模型的研究,在全世界范围依然处于非常早期,甚至概念和技术路径都远没有收敛。”

他比喻说,现在的世界模型,大概相当于2012年的大语言模型。彼时深度学习刚刚兴起,虽然神经网络已有十层、一百层,但依然只能解决较为具体的问题。经过不断升级迭代和互联网海量数据的积累,才有了GPT的出现。

“当下世界模型还没到GPT时代,因为数据非常缺乏。”从2012年到2024年底ChatGPT发布,走了十年。现在随着人工智能越来越强,演化速度越来越快,可能三年五年就能积累出足够数据。

数据是当前最核心的卡点。王仲远坦言,构建世界模型所需的海量真实世界数据依然严重不足,如何从现有数据中充分提取有价值信息,仍是科研上的难题。他举了个有趣的例子:一个两岁的小女孩,天天刷短视频,根本没人教她拆糖果,她却自己学会了。这说明多模态信息对认知形成的推动作用极其显著。对世界模型来说,道理也是相通的——它需要的不是文本,而是真实世界的感知数据,这比语言模型的数据更稀缺,也更难获取。

当前全球范围内,世界模型的技术路线也远未“统一”。王仲远总结了四种主流定义方式:以像素为中心、以三维结构为中心、以视觉表征为中心,以及以语言为中心。智源目前更偏向第四种以及视觉与语言的融合方向,但他也承认,其他路线未必就没价值。这种“百花齐放”的局面,看似造成了认知混乱,但在他看来,这反而是行业走向成熟的必经之路——意味着人才、资本、技术方案都在不断涌现,客观上会促进世界模型的迭代、演进和发展。

青年挑大梁:大四学生成为世界模型团队负责人

值得一提的是,智源世界模型团队的人员构成相当年轻。比如行为世界模型创新中心负责人陈博远,今年才大四。

“智源研究院一直都在强调青年挑大梁,不看帽子资历,给年轻人舞台。这些年轻、高潜力、又有代表作的青年科学家,恰恰是智源成立八年以来一直努力做事的体现,也是智源在大模型时代、多模态时代产生行业和科研成果的基础。”王仲远说。

这样的人才如何被发现?王仲远用“惺惺相惜”来形容:“优秀的人才和天才都是有重力场的,会互相吸引。比如当前世界模型研究团队的两位负责人,是在一个寻常的中午,吃盒饭聊天时‘发掘’出来的。经过谈话,我们发现虽然世界模型有很多定义,但我们的理解和目标完全一致,之后几乎当场拍板,决定要一起来做这件事。”

陈博远也表达了对此的感慨:“可能我并不算是千里马,但伯乐一定非常难寻。在智源研究院搞研发,核心愿景就是制造出能够超越人类智能水平的通用AGI。我觉得这不一定是虚无缥缈的学术理想,它可以实际落地、改变生活。”

王仲远认为,这体现了智源研究院创新的机制体制以及灵活决策的优势。“智源愿意提供这样的环境和舞台,让这群有技术信仰的年轻人聚集在一起,不被外界干扰,不被琐事影响,专心致志进行技术突破。”

这种模式的核心在于几个关键要素:有规划的前沿科研探索,基于对人工智能技术路径的发展;青年挑大梁,不以帽子、不以资历,而是以代表作和潜力选择人才,给予充足的资源搞科研;开源开放的生态,不管是科研成果还是与企业的合作,都让路越走越宽。智源会坚持做这些“对的事情”。

对于世界模型的未来,王仲远保持着乐观但理性的态度。他透露,智源推出的产品中,不论是悟界Physis还是RoboBrain·Orca,目标都不是短期就要在真实物理世界大规模部署,周期可能是三年甚至更长时间。“世界模型是一个长期过程,短期落地不是我们最着急的事。”

被问及前往前沿技术早期“试错”,如果失败怎么办,以及是否考虑更商业化这一问题时,王仲远的回答颇具个人风格:“企业有企业的商业逻辑和商业目标,所以不太可能像我们这样纯粹地思考和探索。对于可能失败的模型、新的方向和技术路径的探索,智源需要担起这样的责任——去开创、去创新、去突破——当然也有可能失败,但这恰恰是科研的魅力所在。”

来源:https://www.163.com/dy/article/KV7EPJCL055284JB.html
上一篇联想发布多项AI体育方案 滴滴App 8.0全新升级 下一篇苹果iOS 27版健康App升级:卡片布局、食物营养评估等
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。