首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
OpenAI o3模型国际象棋夺冠,Grok决赛惨遭零封

OpenAI o3模型国际象棋夺冠,Grok决赛惨遭零封

热心网友
78
转载
2025-08-31

8 月 14 日消息,在上周举行的“人工智能国际象棋表演赛”中,OpenAI 的 o3 模型以出色的表现赢得了冠军,在决赛中战胜了 xAI 的 Grok 4。此次比赛在谷歌旗下的 Kaggle 平台举办,共有八个 AI 模型参与角逐,经过三天的淘汰赛,最终决出冠亚季军。

比赛规则要求 AI 模型在未经过专门训练的情况下参赛,仅能在赛前从互联网上获取国际象棋相关知识。在决赛中,o3 以 4-0 的比分横扫 Grok 4,且在三场比赛中均以 4-0 的比分获胜,还在半决赛中轻松击败了同门的 o4 mini。

相比之下,Grok 4 在决赛前也展现了强大的实力,先后淘汰了谷歌的 Gemini 2.5 Flash 和 Gemini 2.5 Pro。当时,xAI 的创始人埃隆・马斯克曾表示,xAI “基本没在象棋上花功夫”。

注意到,国际象棋对弈网站 Chess.com 的总编辑 Pedro Pinhata 指出,Grok 4 在半决赛前似乎无人能敌,但在最后一天的比赛中,其优势被打破。国际象棋大师中村光在直播中评论称,Grok 4 在比赛中犯了很多错误,而 OpenAI 的 o3 则表现出色。另一位解说嘉宾、国际棋联世界排名第一的芒努斯・卡尔森表示,决赛中两个 AI 的水平相当于刚学会规则的普通棋手,大约 800ELO(等级分)。他指出,这些模型在计算吃子方面表现出色,但在将死对手方面则显得不足,更像“擅长收集食材,却不会做饭”。

值得注意的是,此前在国际象棋领域,专为该棋类设计的人工智能系统表现更为出色。例如,2019 年击败韩国棋手李世石的 AlphaGo 和上世纪击败国际象棋大师加里・卡斯帕罗夫的超级电脑“深蓝”,都是为特定棋类定制的程序。今年早些时候,在国际象棋大师 Levy Rozman 举办的锦标赛中,Grok 和 ChatGPT 均输给了专为国际象棋设计的人工智能系统 Stockfish。

比赛具体成绩如下:

来源:https://www.ithome.com/0/875/204.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

ChatGPT图像识别与语音输入如何实现表格自动填写
科技数码
ChatGPT图像识别与语音输入如何实现表格自动填写

ChatGPT新增图像识别与语音输入填表功能,用户上传表单图片后,可通过语音或文字说明内容,AI自动识别并填写字段。该功能整合多模态能力,需同时完成图像识别、指令理解与内容生成。目前输出为静态图片,对图像质量有要求,尚未支持可编辑文档,旨在让AI更自然地执行连贯任务,简化人工操作。

热心网友
05.23
ChatGPT智能填表技巧图像识别与语音输入全解析
AI资讯
ChatGPT智能填表技巧图像识别与语音输入全解析

OpenAI为ChatGPT新增AI填表功能,用户上传表格图片后,可通过语音或文字指令让系统自动识别表单结构并填写内容,甚至可基于表格生成图片。目前输出为静态图片,对图像质量有要求,但将繁琐流程转化为自然对话,展现了多模态AI助手的实用潜力。

热心网友
05.23
OpenAI 2026年第一季度营收达57亿美元 领先Anthropic
AI资讯
OpenAI 2026年第一季度营收达57亿美元 领先Anthropic

OpenAI在2026年第一季度营收达57亿美元,较竞争对手Anthropic同期高出约10亿美元。其收入主要来自ChatGPT消费级产品,付费用户持续增长,但业务重心正转向企业服务。尽管营收亮眼,公司调整后营业利润率仍为负值,面临显著亏损。为应对竞争与盈利压力,OpenAI正加速推进上市进程,最早或于今年9月进行IPO。

热心网友
05.23
微软Fara1.5浏览器AI模型发布 任务成功率72%超越OpenAI
AI资讯
微软Fara1.5浏览器AI模型发布 任务成功率72%超越OpenAI

微软发布专为浏览器设计的Fara1 5系列AI智能体模型,包含4B、9B和27B三个版本。该模型基于Qwen3 5构建,通过观察浏览器截图输出操作指令,采用“观察—思考—行动”循环决策。在Online-Mind2Web基准测试中,Fara1 5-27B任务成功率达72%,超越多款主流模型。其训练使用了约200万条混合数据,并设计了在信息缺失、任务模糊或执行不

热心网友
05.23
OpenAI破解80年科学难题新模型获顶刊认可
AI资讯
OpenAI破解80年科学难题新模型获顶刊认可

OpenAI一款未发布的通用推理模型独立推翻了悬置近80年的埃尔德什“平面单位距离猜想”。模型未经专门训练,运用代数数论构造反例完成证明。此前OpenAI曾因虚假突破受批评,但此次成果获包括原批评者在内的多位顶级数学家背书,被视为AI自主产出重要数学发现的标志性进展。

热心网友
05.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

企业网络安全等级保护合规指南:龙虾养殖业如何落地实施
AI资讯
企业网络安全等级保护合规指南:龙虾养殖业如何落地实施

摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成,并已由人工审核。 随着企业数字化转型进入智能体(Agent)驱动的新阶段,如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》(等保2 0)的严格框架下,企业级智能体的部署必须同时满足效率提升与合规保障的双

热心网友
05.23
外贸业务员年终总结PPT制作指南 AI高效提升总结效果
AI教程
外贸业务员年终总结PPT制作指南 AI高效提升总结效果

使用情景 对于外贸从业者来说,年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划,既要系统梳理过去一年的业绩成果与经验得失,也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天,一份逻辑严谨、数据详实、洞察深刻的总结报告,不仅是个人专业能力的集中体现,更是赢得管理层支

热心网友
05.23
WPS AI一键生成年度安全工作总结PPT高效制作专业汇报
AI教程
WPS AI一键生成年度安全工作总结PPT高效制作专业汇报

使用情景 又到年末了,年度安全工作总结是每个团队都绕不开的环节。这份总结的价值,远不止于一份简单的回顾。它更像是一份“体检报告”,清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好,哪里还有隐患,从而为来年的精准施策打下坚实的基础。 不过,说起写总结、做PPT,不少人就开始头疼了:内容怎么组织

热心网友
05.23
ZEC价格暴涨520%后还能买吗 深度解析Zcash未来走势与投资潜力
web3.0
ZEC价格暴涨520%后还能买吗 深度解析Zcash未来走势与投资潜力

Zcash (ZEC) 月度暴涨520%:深度解析后市行情与关键点位 近期,隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情,月度涨幅高达520%,价格一度逼近300美元,创下自2021年12月以来的新高。在加密市场整体承压的背景下,ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分

热心网友
05.23
电商售后数据自动汇总分析流程与智能化方案详解
AI资讯
电商售后数据自动汇总分析流程与智能化方案详解

在存量竞争的时代,电商售后数据早已超越了“成本中心”的单一角色,它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而,现实往往骨感:多平台、多店铺、多套ERP系统并存,数据散落一地。靠人工手动汇总?不仅耗时费力,更关键的是,你永远无法实现真正的实时预警与敏捷响应。那么,电商售后数据

热心网友
05.23