英伟达发布 Lyra 2.0:单张照片 AI 生成 90 米 3D 场景,仿真训练机器人提速

来源:IT家人工智能 | 2026-04-17 16:00:07
IT之家 4 月 17 日消息,科技媒体 The Decoder 昨日(4 月 16 日)发布博文,报道称英伟达研究人员推出 Lyra 2.0 系统,可从单张照片生成跨度约 90 米的连贯 3D 环境,解决现有模型在长距离漫游中的画面扭曲与遗忘难题。当前 AI 生成 3D 场景的核心痛点之一,是虚拟摄像机长距离移动后,画面会出现色彩与结构扭曲,返回已探索区域时模型常重新构建环境。英伟达团队为提高机器人仿真训练质量,针对视频模型离开视野即遗忘已见区域,以及逐步生成过程中误差累积导致严重扭曲两大挑战,发布 Lyra 2.0 系统,仅需单张照片即可生成可实时漫游的 3D 场景。Lyra 2.0 通过存储每一帧的 3D 几何数据解决记忆问题,当摄像机重返旧地后,系统调取历史空间信息作为参考,避免重复生成。针对误差累积,研究团队在训练中让模型暴露于自身有缺陷的输出,让其学会识别并纠正质量下降,而非传递错误。基准测试显示,Lyra 2.0 在图像质量、风格一致性和摄像机控制等几乎所有指标上击败 GEN3C、Yume-1.5、CaM 等 6 种竞品,其 Fast 版本在质量相当的情况下,视频生成速度提升约 13 倍。生成的 3D 场景支持交互式探索,并可导出为网格格式用于 Nvidia Isaac Sim 等物理引擎。这意味着训练机器人无需采集真实世界 3D 数据,可在完全生成的虚拟环境中训练。IT之家附上参考地址Lyra 2.0: Explorable Generative 3D Worlds广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
2026-04-02 14:25:00 阿里发布新一代大语言模型Qwen3.6-Plus
2026-04-02 00:00:00 景区商家驱赶拍照游客被停业整改 公共区域拍照权利引争议
2026-04-01 17:21:00 丁真策马飞奔,成龙许愿世界和平,我们在REDGALA找回野心
2026-04-12 00:00:00 泰柬边境一电诈园内部环境曝光 设施齐全监控严密
2026-04-13 00:00:00 官方通报男子反映问题遭威胁 双方说法不一引发热议
2026-04-13 19:00:00 知名记者爆苹果或年底发布AI眼镜 产业链人士:
2026-04-15 00:00:00 两女子泼水节上被人用高压水枪围喷 文明倡议未被遵守
2026-04-15 00:00:00 中美携手可共同定义全球消费趋势 合作潜力巨大
2026-04-16 00:00:00 泼水节变“暴力现场”?女子拒绝仍被高压水枪狂射! 官方已禁止不文明行为
2026-04-16 00:00:00 两小伙因糖尿病酮症酸中毒被送医抢救 年轻不是挥霍健康的资本