首页 游戏 软件 资讯 排行榜 专题
首页
AI
中科院联合CreateAI发布多模态4D世界模型,实现4D场景重建

中科院联合CreateAI发布多模态4D世界模型,实现4D场景重建

热心网友
65
转载
2026-03-06

一篇论文详细介绍了一种名为 NeoVerse 的 4D 世界模型。该模型突破了以往模型在关键可扩展性上的限制,构建了一个可扩展至真实单目视频的训练流程。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

当前,众多“能懂”世界的 AI 正致力于将真实世界转化为可复用的数字世界,期望模型能构建出会动的 3D 世界并生成一致画面。然而,许多 4D 世界模型普遍存在依赖昂贵数据采集或复杂预处理、难以大规模推广的问题。对此,中科院与 CreateAI 联合推出的 NeoVerse,创新性地利用 100 万段开放场景的单目视频进行大规模训练,开辟了构建可扩展 4D 世界模型的新路径。

相关资料

论文与源码链接已提供。

论文介绍

该论文提出了一种名为 NeoVerse 的多功能 4D 世界模型。它能够进行 4D 场景重建、生成新颖轨迹视频,并能应用于丰富的下游任务。研究首先指出,当前主流的 4D 世界建模方法普遍存在可扩展性瓶颈,这要么是由于需要昂贵且专门的多视角 4D 数据,要么是源于繁琐训练预处理流程造成的。

与之相比,NeoVerse 基于一种核心理念构建,使得整个流程能够扩展适配到各种真实场景的单目视频。具体而言,NeoVerse 具备无需姿态先验的前馈式 4D 重建、在线单目退化模式模拟以及其他精心设计的技术。这些设计赋予了 NeoVerse 强大的通用性和泛化能力,使其能够应用于多个领域。同时,NeoVerse 在标准的重建和生成基准测试中均取得了领先的性能表现。

方法概述

上图展示了 NeoVerse 的技术框架。在重建部分,研究提出了一种无需姿态先验的前馈式 4DGS 重建模型,该模型采用双向运动建模。4DGS 在不同视角下的退化渲染结果,将作为条件输入到后续的生成模型中。在训练过程中,退化渲染条件通过单目视频模拟生成,而原始视频本身则作为训练目标。

实验结果

在极具挑战性的实拍视频中,利用大幅度的相机运动生成图像。我们将本方法与相关工作进行了比较,分别针对“向左平移”(左图)和“向右移动”(右图)的情况。NeoVerse 方法在保持精准相机控制的同时,实现了更高的图像生成质量。黄色方框突出显示了伪影问题。

此外,NeoVerse 可与功能强大的 Stable Diffusion LoRA 集成,从而实现不到 30 秒的快速推理速度。运行时评估在单个 A800 GPU 上进行。

结论

该论文介绍了一种名为 NeoVerse 的新型 4D 世界模型,它有效克服了以往模型在关键可扩展性方面的限制,构建了一个能够扩展至真实单目视频的训练流程。因此,得益于丰富的真实数据训练,NeoVerse 的泛化能力和通用性得到显著增强,从而能够应用于各种下游任务。大量实验表明,NeoVerse 在重建和生成任务中均取得了领先的性能。

局限性:NeoVerse 需要具备正确底层 3D 信息的数据进行训练。因此,它不能直接应用于缺乏 3D 信息的数据,例如纯粹的 2D 卡通图像。同时,受限于训练资源,我们精心整理的数据集(100 万个视频片段)规模仍有提升空间。我们为未来的工作保留了更多数据。

来源:https://www.51cto.com/article/837494.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中科院联合CreateAI发布多模态4D世界模型,实现4D场景重建
AI
中科院联合CreateAI发布多模态4D世界模型,实现4D场景重建

论文介绍了一种名为 NeoVerse 的 4D 世界模型,它克服了以往模型的关键可扩展性限制,构建了一个可扩展至真实单目视频的训练流程。 当下众多“能动”AI 致力于将真实世界转化为可复用数字世界,

热心网友
03.06
鸿蒙智行2024/2025款车型搭载4D毫米波雷达,选购方案已落地用户中心
科技数码
鸿蒙智行2024/2025款车型搭载4D毫米波雷达,选购方案已落地用户中心

10 月 23 日消息,鸿蒙智行智界 2024 2025 款车型 4D 毫米波雷达付费选购方案于今年 9 月开启意向登记。智界产品总监 @智界海蓝天 今日宣布,4D 毫米波雷达可以在用户中心更

热心网友
12.05
鸿蒙智行智界2025款开启4D毫米波雷达选配,4999元起预订
科技数码
鸿蒙智行智界2025款开启4D毫米波雷达选配,4999元起预订

9 月 2 日消息,智界产品总监 @智界海蓝天 在 8 月 24 日公布了针对老车主三项优化事项中的最后一项 —— 4D 毫米波付费选购方案。该方案面向智界 S7 Max 及以上版本、智界 R7

热心网友
09.03
鸿蒙智行智界汽车“最后一件事”虽迟但到: 2024 / 2025 款车型 4D 毫米波雷达付费选购方案官宣
科技数码
鸿蒙智行智界汽车“最后一件事”虽迟但到: 2024 / 2025 款车型 4D 毫米波雷达付费选购方案官宣

8 月 24 日消息,智界产品总监 @智界海蓝天 今日公布了针对老车主三项优化事项中的最后一件 —— 4D 毫米波付费选购方案。附“智界汽车新增服务公告”原文如下:感谢 10 万 + 智界车主的坚

热心网友
08.25

最新APP

你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25
诸神皇冠
诸神皇冠
棋牌策略 03-25

热门推荐

猎豹浏览器免安装网页版:在线云端使用入口与教程
电脑教程
猎豹浏览器免安装网页版:在线云端使用入口与教程

猎豹浏览器免安装网页版入口是https: web lemur-browser com,具备界面简洁响应迅速、多端同步无缝衔接、安全防护层级丰富、文档处理能力突出、资源兼容性广泛覆

热心网友
03.27
昆仑万维发布三大世界第一梯队AI模型
科技数码
昆仑万维发布三大世界第一梯队AI模型

据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels

热心网友
03.27
杨植麟、张鹏、夏立雪、罗福莉论道大模型:未来一年趋势前瞻
科技数码
杨植麟、张鹏、夏立雪、罗福莉论道大模型:未来一年趋势前瞻

本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2

热心网友
03.27
Anthropic核心模型意外泄露,网络安全股面临冲击风险
科技数码
Anthropic核心模型意外泄露,网络安全股面临冲击风险

Anthropic一款尚未发布的新AI模型因数据泄露意外曝光,引发市场对AI颠覆网络安全行业的担忧再度升温,网络安全板块股价周五盘前全线下挫。据《财富》杂志报道,Anthropic正在开发并已开始向

热心网友
03.27
Token经济到来,解析互联网大厂的布局与冷思考
科技数码
Token经济到来,解析互联网大厂的布局与冷思考

3月初,腾讯在深圳总部楼下设立“龙虾站”,引发千人排队尝鲜。OpenClaw掀起的“全民养虾”热潮,在短短一个月内让更多人看到了AI Agent深入业务场景的价值,随即推动Token调用量大规模增长

热心网友
03.27