英伟达Lyra 2.0发布 单张照片生成90米3D场景
仅凭一张静态照片,就能创造出一个可供自由探索的广阔3D世界?这听起来如同科幻场景,但英伟达的研究团队正将其变为现实。据科技媒体The Decoder报道,其最新发布的Lyra 2.0系统,实现了仅从单张输入照片即可构建出跨度长达90米的连贯3D环境,精准攻克了当前AI在长距离场景生成中的核心难题。

那么,这一核心难题究竟是什么?简而言之,可概括为“远行即失真,回溯则遗忘”。目前许多3D生成模型在虚拟摄像机进行长距离移动后,常出现色彩偏差与结构变形。更棘手的是,当摄像机返回已探索区域时,模型往往无法保持场景一致性,仿佛“忘记”了先前构造的内容,导致画面前后矛盾。

为了大幅提升机器人仿真训练的真实性与效率,英伟达团队聚焦于两大挑战:一是解决视频模型“视野之外即丢失”的记忆短板,二是抑制生成过程中误差逐步累积所引发的严重画面畸变。他们的答案便是Lyra 2.0——一个仅需单张照片即可实时生成并支持自由漫游的3D场景系统。

Lyra 2.0的卓越性能源于其创新的“记忆存储”与“误差校正”双机制。针对记忆问题,系统会持续存储每一帧的3D几何数据。当摄像机重返旧地时,可直接调用这些历史空间信息作为生成依据,确保了场景的时空一致性,避免了重复生成。面对误差累积的顽疾,研究团队在模型训练阶段引入了关键策略:让模型反复接触并学习其自身有缺陷的输出,从而训练其主动识别并修正质量下降的部分,有效阻断了错误的传递链条。

实际效果如何?权威基准测试提供了有力证明。在与GEN3C、Yume-1.5、CaM等六种前沿技术的对比中,Lyra 2.0在图像质量、风格一致性及摄像机控制精度等几乎所有关键指标上均占据领先。其“Fast”版本表现尤为突出,在维持相近生成质量的同时,将视频生成速度提升了约13倍,这为实时交互与沉浸式应用铺平了道路。

这项突破意味着什么?首先,它支持真正的交互式3D场景探索,带来深度沉浸的用户体验。其次,生成的场景可导出为通用网格格式,无缝接入如Nvidia Isaac Sim等物理仿真引擎。一个清晰的应用前景由此展开:未来训练机器人或自动驾驶系统,可能无需耗费高昂成本采集海量真实世界3D数据;利用Lyra 2.0生成的、无限多样的高保真虚拟环境,即可完成高效、安全且可扩展的仿真训练。从一张照片到一个世界,3D内容创作与数字孪生的范式,正在被重新定义。
相关攻略
HermesAgent是一款开源自主AI智能体框架,定位为可持久运行、自我进化的“数字员工”。它以任务完成为导向,通过四层架构处理信息、操作文件、执行终端命令及自动化浏览器,支持六种部署方式,并通过统一网关接入微信等多平台。其关键特性在于能从任务经验中自动提炼并复用技能,实现持续进化,越用越。
近期,世界模型领域动态频频,竞争日趋白热化。 李飞飞教授创立的具身智能公司 World Labs 高调发布了「Spark 2 0」模型;几乎同时,阿里巴巴也推出了自家的世界模型「快乐生蚝」。此外,Physical Intelligence 公司发布了新模型 π 0 7,重点强调了其在未见任务上的组合
近日,2026北京亦庄机器人半程马拉松赛事现场,一款造型独特的机器人意外成为焦点,在网络上引发了广泛讨论。这款被网友昵称为“豆脚”的机器人,以其极具辨识度的外观和有趣的行走姿态,迅速走红。 “豆脚”机器人的创意来源于抖音平台的虚拟IP“豆包”。其创作者、抖音博主“同济子豪兄”基于高擎动力的小派机器人
“跑马拉松的机器人和我们,完全是两个领域。我们和做语言模型的公司,距离反而更近。” 就在不久前,一场机器人马拉松吸引了无数目光。那些拥有刀锋般双足的机器人,跑出了超越人类的速度。然而,在自变量科技CEO王潜看来,这更多是硬件能力的展示,而真正的战场,在于“大脑”。 “硬件在中国,从来都不是壁垒。今天
FigureAI三台人形机器人在物流仓库进行了超40小时全自主分拣直播,处理数千件包裹并自主充电交接。直播旨在回应对其实用性的质疑,展示其在工业场景中的稳定性与操作能力。尽管其自适应抓取与异常处理表现突出,完全自主性仍存争议。目前国内外多家公司已在物流领域部署类似机器人。
热门专题
热门推荐
在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过
你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整
如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏
当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围
当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓





