阿里新模型登顶权威评测榜单继HappyHorse后再创佳绩

首页

热心网友

转载

2026-05-19

短短两周内，阿里巴巴在人工智能领域连续发布两项突破性进展。继月初的HappyHorse模型在权威评测平台Artificial Analysis荣登榜首之后，其最新推出的具身世界模型ABot-PhysWorld，又在全球顶尖的WorldArena评测中斩获第一。

WorldArena评测体系由清华大学领衔，联合普林斯顿大学、新加坡国立大学、北京大学等全球八所顶级学术机构共同打造，其权威性备受业界认可。该评测标准极为严格，设立了16项核心能力指标与3大类真实世界任务，旨在全面检验各类世界模型的综合性能——从基础的视觉感知精度、物理规律理解，到进阶的三维空间认知与长序列动作预测，均需接受系统性考核。

ABot-PhysWorld模型为何能在如此激烈的竞争中胜出？其核心优势在于对物理世界的深度理解与卓越的长程预测能力。与许多仅能生成短时、静态或视觉效果为主的模型不同，ABot-PhysWorld能够精准模拟并预测物体在复杂交互中的动态演变，无论是滑动碰撞、物体倾倒、多层堆叠还是流体运动，其生成结果均能保持高度的因果逻辑一致性与物理真实性。

这意味着，该模型的输出是“可解释、可推理”的。这种深度物理理解能力，使得ABot-PhysWorld的价值远超于生成炫酷视频，在机器人任务规划、工业流程异常预判、自动驾驶决策等需要高可靠性AI的实际应用场景中，展现出巨大的商业化落地潜力。

消息来源：高德

来源:https://www.163.com/dy/article/KQKO3TPJ0511DSSR.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：Meta押注神经网络计算机突破智能体与世界模型局限下一篇：Allbirds转型AI科技股价暴涨582% 鞋企困境中逆袭

相关攻略

阿里新模型登顶权威评测榜单继HappyHorse后再创佳绩

短短两周内，阿里巴巴在人工智能领域连续发布两项突破性进展。继月初的HappyHorse模型在权威评测平台Artificial Analysis荣登榜首之后，其最新推出的具身世界模型ABot-PhysWorld，又在全球顶尖的WorldArena评测中斩获第一。 WorldArena评测体系由清华大学

热心网友

05.19

智能体评测新阶段为何需要动态基准测试

当前AI智能体评测面临两大挑战：验证任务真实完成度及评测任务是否反映现实需求。Claw-Eval通过审计执行过程、日志与环境快照，证明仅看结果会高估模型能力；Claw-Eval-Live则构建动态基准，依据真实工作流定期发布版本，确保评测贴近当下需求。测试显示，模型在跨系统业务任务上表现薄弱，且成本差异显著。

热心网友

05.11