马斯克xAI推出世界模型,视觉AI将成下一个风口
AI竞赛的下一个战场已然清晰:从文本世界走向物理世界。在这场名为“世界模型”的竞赛中,马斯克旗下xAI已携英伟达专家悄然入局,与谷歌、Meta等巨头同台竞技。xAI计划率先将该技术应用于AI游戏生成,并探索其在机器人系统的应用。谷歌推断,未来的视频模型将变得和语言模型一样智能。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
麻 将人工智能领域的战火正在从大语言模型蔓延至一个更前沿的领域——能够理解并模拟真实物理世界的“世界模型”(World Models)。而xAI已悄然加入这场竞赛,与谷歌和Meta等科技巨头同台竞技。
据英国《金融时报》10月12日报道,马斯克的初创公司xAI在今年夏天从芯片巨头英伟达聘请了人工智能专家,专门从事世界模型的研发。与依赖文本的大语言模型不同,世界模型通过对海量的视频和机器人数据进行训练,旨在掌握真实世界的物理规律。
“未来的视频模型将变得和语言模型一样智能”,谷歌研究人员在论文中说道。英伟达上月也曾表示,世界模型的潜在市场规模可能接近当前全球经济的总量。
01
兵马先行:
xAI的游戏“奇袭”与机器人野望
为了在这场竞赛中占据一席之地,xAI正在积极招兵买马。
公司已聘请了来自英伟达的两位AI研究员Zeeshan Patel和Ethan He,他们在世界模型领域拥有丰富经验。英伟达凭借其用于创建和运行模拟的Omniverse平台,一直是该技术的领导者。
知情人士透露,xAI为世界模型规划的第一个商业化落点是游戏领域,用于生成可交互的3D环境。这一动态迅速引发市场关注,因为它不仅是xAI商业化路径的明确信号,也凸显了世界模型作为下一代AI技术的巨大潜力。
马斯克本人也在社交平台X上确认,xAI将在“明年年底前发布一款出色的AI生成游戏”。长远来看,这些技术最终可能应用于机器人的人工智能系统。

xAI的招聘信息也印证了其发展方向。公司正在为其“omni团队”招聘图像和视频生成领域的技术人员,薪资范围高达18万至44万美元,该团队致力于“创造超越文本的神奇AI体验”。
此外,公司还在以时薪45至100美元招聘“视频游戏导师”,以训练其AI模型Grok制作视频游戏。
02
范式转移:
视觉模型的“GPT”时刻
xAI的高调入局,恰逢一个关键的行业预判浮出水面:未来的视频模型将变得和语言模型一样智能。谷歌最近的一篇论文指出,其视频模型Veo 3正展现出与大语言模型(LLM)相似的“涌现能力”。
正如LLM通过“下一词元预测”的简单任务,最终学会了数学和创意写作等额外技能,视频模型通过“下一帧预测”,也开始零样本(zero-shot)地解锁一系列令人惊讶的能力,例如物体分割、边缘检测和模拟工具使用等,而这些都未经专门训练。

谷歌的研究人员Jack Clark在论文中写道:“我们认为,正如自然语言处理(NLP)从特定任务模型转向通用模型一样,机器视觉领域也可能通过视频模型发生同样的转变——一个‘视觉领域的GPT-3时刻’。”
他们将视频逐帧生成的过程类比为语言模型中的“思维链”(chain-of-thought),并称之为“帧链”(chain-of-frames),认为这使得视频模型能够跨越时空进行推理。
这一发现意义深远,它暗示着通过发展更智能的视频模型,人们或许能够获得能力极强的机器人“代理”(agent)。
03
前景与现实:
高昂的成本与“愿景”的缺失
尽管前景诱人,但通往世界模型的道路并非坦途。目前,该技术仍面临巨大的技术挑战,其中最主要的是为模拟真实世界寻找和处理足够训练数据的成本极其高昂。
与此同时,业界也存在对AI作用的冷静审视。热门游戏《博德之门3》的开发商Larian Studios的发行主管Michael Douse本周在X上表示,AI无法解决游戏行业的“大问题”,即“领导力和愿景”。
他补充说,行业需要的不是“更多由数学方式生产、经过心理学训练的游戏循环”,而是对世界更多样化的表达。这代表了一种普遍的观点:纯粹的技术突破本身,并不能保证创造出能够真正打动人心的商业产品。
尽管挑战重重,但xAI的入局无疑为世界模型的竞赛再添一把火。
AI的焦点正不可逆转地从纯粹的数字信息处理,转向对复杂物理现实的模拟与交互。视觉模型是否能复刻大语言模型的辉煌,迎来属于自己的“GPT时刻”,不仅将决定下一代AI霸主的归属,更可能重塑我们与数字及物理世界的根本关系。
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





