腾讯开源强化学习框架WorldCompass,面向世界模型后训练
3月10日,据IT之家消息,腾讯混元3D团队今日宣布开源业界首个面向世界模型的强化学习后训练框架WorldCompass。该框架是此前发布的混元世界模型1.5的最新强化学习扩展模块,旨在显著提升世界模型交互的准确性与体验流畅度。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

WorldCompass是一个专为长时序、交互式世界模型设计的强化学习后训练框架。若将世界模型比作引擎,那么WorldCompass便是“指南针” —— 它通过引入强化学习机制,直接引导模型更精准地遵循用户指令探索世界,并确保长时序下的视觉一致性。
实验数据表明,WorldCompass能够有效提升SOTA开源世界模型的交互准确率和视觉保真度。特别是在复杂的组合动作场景下,交互准确率提升近35%。
团队在最新的开源SOTA模型WorldPlay上进行了验证。结果显示,经过WorldCompass的后训练,模型能力实现了显著提升。

在最困难的复合动作场景下:基座模型对于复杂组合式动作序列执行的准确率仅为20%左右。使用WorldCompass训练后,准确率提升至55%左右,提升幅度超过35%。对于基础动作,准确率也提升了约10%。
同时,在斯坦福大学世界模型Benchmark WorldScore上,WorldCompass取得了更好的评分:

相关攻略
IT之家 3 月 27 日消息,腾讯云今日正式发布 Agent 产品全景图,构建了从个人到企业、从基础设施到上层场景应用的完整产品体系。该体系围绕 Agent 基础设施层、模型服务层、技能生态层、A
IT之家 3 月 27 日消息,在今日的 2026 中关村论坛年会《OpenClaw 与 AI 开源圆桌会议》上,月之暗面创始人杨植麟担任主持,并与智谱华章 CEO 张鹏、小米 MiMo 大模型负责
3月24日傍晚,小米集团发布2025年第四季度及全年业绩公告。尽管公司全年业绩再创新高,但去年第四季度却出现增收不增利的情况。财报显示,2025年,小米实现总收入4572 9亿元,同比增长25%;录
财联社3月25日电,今日开幕的2026中关村论坛年会上,月之暗面创始人杨植麟表示,大模型训练进入第三个阶段。2024-2024年为天然数据与人工标注阶段,2025年为人工精选可验证任务阶段,2026
热门专题
热门推荐
猎豹浏览器免安装网页版入口是https: web lemur-browser com,具备界面简洁响应迅速、多端同步无缝衔接、安全防护层级丰富、文档处理能力突出、资源兼容性广泛覆
据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
Anthropic一款尚未发布的新AI模型因数据泄露意外曝光,引发市场对AI颠覆网络安全行业的担忧再度升温,网络安全板块股价周五盘前全线下挫。据《财富》杂志报道,Anthropic正在开发并已开始向
3月初,腾讯在深圳总部楼下设立“龙虾站”,引发千人排队尝鲜。OpenClaw掀起的“全民养虾”热潮,在短短一个月内让更多人看到了AI Agent深入业务场景的价值,随即推动Token调用量大规模增长





