如今,AI大模型的应用场景已深入人心。从“文生文”到“文生图”,再到“文生视频”,技术正不断刷新我们的想象。而12月17日,腾讯混元发布的WorldPlay世界模型1.5版本,更进一步解锁了“文生3D”和“图生3D”的全新能力。
具体而言,用户只需输入文字描述或上传图片,就能创建专属的互动虚拟世界。通过键盘、鼠标或手柄,你可以实时操控虚拟相机的移动和转向,像玩游戏一样,在AI生成的世界里自由探索。这是国内首个开放体验的实时世界模型,用户已可通过腾讯混元3D官网正式申请使用(https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)。
与此同时,混元世界模型1.5(WorldPlay)首次开源了实时世界模型的全栈框架,覆盖数据、训练、流式推理部署等全链路环节。框架中还提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等核心算法模块。
混元世界模型1.5为世界构建带来了崭新的可能。用户能在生成的世界里随意移动探索,当你离开某个区域后再次返回,模型能够“记住”该区域的三维结构,呈现出前后一致的场景——这种空间记忆能力,标志着模型在三维世界理解上取得了重要突破。此外,用户还可以将用于交互的3D场景,导出为可重复使用的3D点云数据。
编辑 杨媛媛
校对 柳宝庆
