腾讯TiG框架:AI玩转王者荣耀,DeepSeek/Qwen练就战略思维
10月4日最新消息,腾讯AI实验室在其最新研究中创新性地选取了《王者荣耀》这款热门MOBA游戏作为实验平台,开发了名为TiG(Think in Games)的全新AI训练框架。这项突破性研究成果已在Hugging Face和arXiv两大权威学术平台正式发布。

研究团队在论文中指出,当前AI系统存在明显的认知断层问题:传统游戏AI虽然在操作执行层面表现出色,但缺乏真正的战略思考能力;而大语言模型虽能进行战术推演,却难以将思考转化为具体游戏行为。TiG框架的创新之处在于实现了AI思考与行动的同步闭环。

实验设计中,研究人员精选了《王者荣耀》中40个典型战术场景,包括上路压制、暴君争夺、高地防守等核心战术行为。为确保数据公正,样本中胜负场次保持均衡。AI不仅需要做出正确的战术选择,还必须给出符合游戏逻辑的战略分析。

训练过程采用创新性的双阶段模式:第一阶段通过监督学习让AI掌握基础决策模式;第二阶段引入激励机制进行强化学习,正确决策获得1分奖励,错误则不计分,以此巩固模型的战术判断能力。

研究团队对比测试了Qwen系列多个版本的语言模型(7B/14B/32B参数),并以DeepSeek-R1大模型作为基准参照。实验创新性地采用"群体相对策略优化"(GRPO)技术,通过DeepSeek-R1生成的高质量训练数据进行策略优化。

令人惊喜的是,经TiG框架训练的AI不仅能执行战术动作,还展现出类人的战术解说能力。例如,AI会分析指出:"对方下路防御脆弱,适合发起突袭,但要警惕敌方打野反蹲。"值得注意的是,这些AI在获得游戏智能提升的同时,原有的语言理解和逻辑推理能力完全保留。

最终测试数据验证了TiG框架的有效性:
对照组DeepSeek-R1:86.67%决策正确率
Qwen3-14B:90.91%的正确率表现最为突出
Qwen2.5-32B:准确率提升幅度达20.17个百分点
Qwen2.5-14B:准确率提升29.87个百分点的飞跃式进步
热门专题
热门推荐
洞察市场先机:SOL合约持仓量深度解析与实战应用 在瞬息万变的加密货币衍生品市场,SOL合约持仓量如同一张实时绘制的“资金热力图”。它不仅揭示了多空双方投入的真实资本规模,更映射出市场情绪的微妙变化与潜在的趋势转折点。对于精明的交易者而言,掌握解读这张“地图”的能力,意味着能在市场博弈中抢占信息高地
《像素秘境·唤灵师》可通过九游APP或官网下载。在九游APP搜索游戏名即可预约并获取最新版,官网专区也提供高速与普通下载选项。两种方式均能便捷安装,专区还附有游戏攻略供参考。
车市价格战正处微妙临界点。二季度起,一股与以往降价潮不同的涨价暗流开始酝酿。截至五月中旬,至少15家主流新能源品牌已释放调价信号,或直接涨价,或收紧优惠,涉及比亚迪、特斯拉、蔚来等传统及新势力车企。
说起《上古卷轴5:重制版》的主线旅程,奥杜因克星任务绝对是一座绕不开的高峰。它不仅是叙事的关键转折点,更是一场对玩家策略、操作与耐心的综合试炼。想要征服这条恶龙,光有勇气可不够,一份清晰的行动路线图至关重要。接下来,我们就一起梳理一下这场终极对决的核心脉络与实用技巧。 一、剑指目标:前往奥杜因克星的
SOL合约限价单的最小价格单位是0 001美元。该单位是交易时报价的最小变动值,直接影响订单的精确性与灵活性。了解此规则对合约交易者有效设置订单和管理策略至关重要。





