AMD携手博洛尼亚大学推进空间AI 赋能机器人及自动驾驶技术
AMD Silo AI与博洛尼亚大学计算机科学与工程系(DISI)正式建立研究合作伙伴关系,致力于将显式三维几何信息深度整合到面向机器人与自动驾驶的视觉-语言-动作(VLA)模型及世界模型开发流程中,并确保其原生高效运行于AMD ROCm™开放软件平台。此次合作将DISI旗下在立体视觉与深度估计领域享有盛誉的研究团队CVLab,确立为双节点学术枢纽中的“空间AI”核心节点,与摩德纳雷焦艾米利亚大学(UniMoRE)形成协同。该枢纽将持续为AMD Silo AI的开放式物理AI研究项目“世界模型铸造厂”(World Models Foundry)提供关键技术支撑,并与欧盟科学AI工厂等欧洲前沿战略计划保持紧密联动。

AMD软件开发高级总监Niko Vuokko对此表示:“下一代机器人与自动驾驶技术的突破,不仅需要能够识别或生成内容的AI系统,更关键的是构建对三维物理世界具有深刻、一致理解的智能体。这些系统必须在时间推移和视角变换中保持稳定认知,并在计算平台上实现高性能运行。这正是我们此次合作的战略目标。”他进一步阐述:“我们将携手DISI及生态系统伙伴,共同构建当前VLA与世界模型流水线中所缺失的‘空间AI’感知层。我们的目标是将几何理解领域的前沿学术成果,转化为开放、高性能且原生支持ROCm的软件模块,从而推动整个物理AI生态系统的实质性进步。”
DISI CVLab在立体视觉、深度估计与三维场景重建方面拥有长期深厚的技术积淀,其研究成果屡次发表于CVPR、ICCV、ECCV等国际顶级计算机视觉会议。根据合作框架,AMD Silo AI将与CVLab联合研发先进的感知与场景表示模块,将显式的三维几何与深度信息无缝集成到端到端的VLA架构及世界模型架构中。所有研究工作将优先适配并优化于AMD Instinct™ MI系列GPU及未来的ROCm平台。
三大核心研究方向
本次产学研合作将重点围绕以下三个核心方向展开深入探索:
几何感知骨干网络:重点研究立体视觉匹配、单目/多目深度估计、多视角感知融合、鸟瞰图(BEV)生成以及高效的三维场景表示方法。
基于ROCm的高效几何感知训练与推理:优化针对BEV与点云数据的处理流水线,开发能够集成于端到端VLA模型中的轻量化几何模块,并实现其在ROCm平台上的高性能训练与部署。
面向机器人与自动驾驶的评估体系:构建结合仿真环境与真实世界数据的综合评估基准,重点关注模型的空间推理能力、三维一致性保持,以及对视角变化、物体遮挡等复杂场景的鲁棒性。
博洛尼亚大学(DISI)副教授Matteo Poggi表示:“我们团队长期致力于研究如何让机器从二维图像中准确恢复三维世界的深度、形状与结构信息。此次合作提供了一个绝佳契机,能将我们在几何感知方面的专长,融入到更宏大的VLA与世界模型技术体系中,并直接应用于机器人与自动驾驶这一前沿领域。依托AMD强大的硬件与软件平台,我们有望将前沿的几何视觉研究成果,转化为ROCm原生的基础软件组件。这些组件将在实际平台上得到验证,并以开源形式发布,供全球开发者社区使用、改进与创新。”
需要特别指出的是,本次合作具有明确的产业落地导向——意大利知名机器人公司Generative Bionics将深度参与其中。该公司专注于为实际应用场景设计和部署全栈式人形机器人解决方案。它将与DISI、UniMoRE及AMD展开紧密的工程化协作,将真实机器人部署中遇到的挑战与经验反馈至研究环节,从而加速将空间AI科研成果转化为稳定、可用的机器人产品平台。
关于博洛尼亚大学与CVLab
博洛尼亚大学创立于1088年,是欧洲历史最悠久、学术声誉卓著的研究型大学之一。CVLab是其计算机科学与工程系下属的核心实验室,在立体视觉、深度估计、三维重建及几何感知人工智能领域拥有深厚的技术专长。其研究成果广泛发表于CVPR、ICCV、ECCV、ICRA等顶级国际会议,并积极贡献于三维视觉领域的多个开源基准测试数据集与工具生态。
合作详情问答
Q1:AMD Silo AI与博洛尼亚大学的空间AI合作具体研究什么内容?
此次合作的核心是研究如何将显式三维几何信息整合到VLA模型和世界模型开发流程中。主要聚焦三大方向:一是开发几何感知骨干网络(包括立体视觉、深度估计、BEV感知等);二是实现基于AMD ROCm平台的高效几何感知模型训练与推理优化;三是建立面向机器人与自动驾驶应用的专项评估体系。所有成果将原生支持ROCm,并向开源社区开放。
Q2:CVLab在这次合作中扮演什么角色?
CVLab是博洛尼亚大学DISI下属的顶尖计算机视觉研究团队,尤其在立体视觉、深度估计和三维重建方面积累深厚。在此次合作中,CVLab被定位为双节点学术枢纽中的“空间AI”技术核心,负责与AMD Silo AI联合研发关键的感知与三维表示模块,目标是将几何理解的前沿算法转化为高性能、开源、且原生支持ROCm的软件工具。
Q3:Generative Bionics在此次合作中起到什么作用?
Generative Bionics是意大利一家领先的机器人技术公司,专注于全栈式人形机器人系统的研发与场景化部署。在此次合作中,该公司将作为重要的产业合作伙伴,与学术机构及AMD进行紧密的工程协作,将其在真实机器人部署中的实践经验与需求融入研究体系,从而助力空间AI研究成果快速转化为具备实际应用价值的机器人平台解决方案,确保研究的产业相关性。
相关攻略
AMDSiloAI与博洛尼亚大学合作,将三维几何信息融入面向机器人与自动驾驶的视觉-语言-动作模型及世界模型流水线。研究聚焦几何感知骨干网络、基于ROCm的高效训练推理及面向实际应用的评估体系,旨在将前沿几何理解转化为开放的高性能软件,并获机器人企业参与以推动成果落地。
自动驾驶规划与控制模块将感知信息转化为车辆可执行轨迹。规划模块负责生成安全舒适路线,控制模块通过PID、LQR等算法实现精准轨迹跟踪。系统以C++实现,需满足毫秒级实时性,并通过仿真与实车测试确保安全稳定。
周鸿祎回应马斯克“十年后人类驾驶或成小众”的预言,引发热议。支持者认为AI将重塑交通,缓解拥堵、减少事故;质疑者则强调技术需与社会接受度同步,短期难有巨变。讨论触及AI与人类共处的核心议题,反映公众对技术既期待又审慎的复杂心态。
导远科技以百分之百正向设计构建核心竞争力,其高精度定位方案已服务全球超100款车型。公司通过自研芯片掌握产品定义权,依托数智化产线实现高质量量产,并借助中国市场快速迭代优势与产业链协同进化。技术正向机器人等领域迁移,以平台化战略推动生态共荣,逐步从产品供应商向。
2026年L4自动驾驶加速迈向日常生活。魔视智能以全栈自研覆盖多场景,并拓展海外Robotaxi;卓驭科技聚焦移动物理AI,与一汽等合作布局L3 L4方案;佑驾创新凭借“真无图”技术实现无人物流商业化并出海;元戎启行则依托量产数据联合德赛西威推进落地。
热门专题
热门推荐
在高铁站寻找22人需掌握方法。先快速观察候车厅、检票口等布局,重点排查座椅区、寄存处等人员密集区域,留意人物神态动作。同时关注排队人群、工作人员及自动售货机、卫生间等边角位置。通过服饰、发型等细节特征,按整体到局部顺序耐心识别,即可逐步完成目标。
千咲技能加点需根据战局动态调整。前期优先点满核心近战技能以强化输出与生存。中期侧重远程支援技能,提升控制与治疗能力。后期追求均衡,协同发展近战伤害与支援效果,使其成为能灵活切换姿态的关键战力。
梦魇恶谷是《传奇国度》中地形复杂、强敌环伺的隐藏副本,进入需完成前置任务。挑战需熟悉地形特点,应对高难度敌人,并依靠团队协作与合理策略。击败BOSS可获得珍稀装备,过程中需注重技能升级、资源收集与道具运用。持之以恒并从失败中汲取经验是征服该副本的关键。
新手进入洛克王国,首先需创建角色并熟悉核心地图区域。关键在于捕捉并培养宠物,通过战斗提升其能力。积极完成各类任务以获取成长资源,并掌握属性克制等战斗策略。此外,参与社交互动与探索隐藏地点能显著提升游戏体验,助力快速融入冒险世界。
利用NotionAI生成GitHub项目README需提供清晰指令并分步操作。首先构建结构化提示词模板,要求包含标题、功能、安装等六个部分。随后注入项目真实元数据确保内容准确。采用分段生成与人工校验避免格式错误,并可利用Notion公式动态更新版本号。最后导出为Markdown并验证渲染效果,确保文档专业可用。





