10月13日最新消息,根据IT之家转引伦敦《金融时报》的报道,埃隆・马斯克创立的xAI公司正在加速开发其“世界模型”技术,与Meta和谷歌等科技巨头竞逐新一代人工智能系统的研发赛道。这类系统具备对物理空间及环境的自主探索与创建能力。
世界模型作为一类生成式人工智能,能够解读现实世界的动态运行规律和物理特性,包括空间关系等复杂属性。该模型通过综合处理文本、图像、视频甚至运动数据,进而生成动态影像内容。
据悉,xAI已从英伟达引入多位专业人才,共同推进这类新型AI模型的研发进程。这些模型通过分析视频资料和机器人采集的数据,逐步构建对真实世界的认知框架。业内专家认为,世界模型有望推动人工智能实现跨越式发展,突破当前以大语言模型为主的技术边界。目前主流的ChatGPT及xAI旗下Grok等智能工具,其核心仍是基于大量文本训练的语言模型。
两位接近项目的知情人士透露,该公司正将世界模型技术率先应用于游戏领域,用于创造具有交互功能的3D虚拟场景。其中一位消息人士进一步表示,这类模型未来同样适用于机器人AI系统的开发。
在人才引进方面,xAI成功招募了英伟达的两位资深AI研究员——泽尚・帕特尔与何宜晖,这两位专家在世界模型领域拥有丰富经验。值得一提的是,英伟达凭借其能够构建并运行仿真环境的Omniverse平台,长期以来在该技术领域保持领先优势。
多家科技企业看好世界模型的发展前景,认为这项技术或将推动AI应用从软件和计算设备向实体产品延伸,例如人形机器人等创新产品。英伟达在上个月向《金融时报》表示,世界模型可能催生的市场价值,或将接近当前全球经济的总体规模。
马斯克近日在社交平台X上发文确认,xAI计划在明年年底前推出“一部由人工智能生成的优质游戏作品”,这也延续了他在去年制定的战略目标。
本周二,xAI正式发布了新一代图像与视频生成模型,并宣布该模型已完成“重要技术升级”,同时向所有用户免费开放使用权限。
现阶段,OpenAI的Sora等视频生成模型主要依赖从训练数据中提取的模式进行预测,通过逐帧生成的方式构建视频内容。而世界模型技术将实现质的飞跃,因为它能够实时解析物理世界的因果关系,准确掌握物体在不同情境下的交互规律。
然而,世界模型的研发仍面临显著的技术瓶颈。获取足够的数据来精确模拟现实世界并有效训练这些模型,已被证实是既复杂又耗资巨大的挑战。
《博德之门3》开发商拉瑞安工作室的发行主管迈克尔・道斯本周在X平台发表评论,指出人工智能并不能解决游戏行业面临的“根本性问题”,即“领导力与创新视野的匮乏”。
他进一步强调,游戏产业真正需要的是“更多能引发玩家共鸣、值得投入的虚拟世界呈现方式”,而非“大量由算法生成、经过心理学设计的重复玩法机制”。
截至本文发布前,xAI公司及帕特尔、何宜晖两位研究员尚未对相关事宜作出正式回应。
