OpenAI突然公开o3思维链细节，网友集体感谢DeepSeek的推动

时间：2026-06-30 15:52

OpenAI公开o3-mini完整思维链，但经后处理而非原始版本。开发者担忧经过总结的CoT可能更差。实测显示能正确玩井字棋，但数r问题仍需改进。官方称后处理旨在消除不安全内容并支持多语言。

OpenAI 终于正式公开了 o3-mini 的完整思维链。这一举措本身释放了一个明确信号：曾经被视为核心机密的推理过程，如今不再严格保密。不过，公开归公开，实际效果究竟如何，恐怕还需要打上一个大大的问号。开发者 Mckay Wrigley 率先补了一刀——他担心经过摘要处理的思维链，可能比完全不公开还要糟糕。

但无论如何，既然已经对外发布，免费用户现在也能一睹 o3-mini 的 CoT（思维链）全貌，大家自然纷纷开始上手体验。

o3-mini 思维链首批实测结果

OpenAI 多模态 Agent 的研究员率先展示了自己的玩法——让 o3-mini 挑战井字棋游戏，也就是那个在 3×3 格子中用 O 和 X 连线的经典益智游戏。

输入提示词后，o3-mini 立刻开始了噼里啪啦的推理过程。

这位 OpenAI 员工直言不讳地表示：o3-mini 是第一个能正确完成这个游戏的大模型。不过，他还补充了一句——“虽然 o3-mini 的 CoT 过程有点不太靠谱，但你看右边的图，结尾处它还是搞明白了”。这番话，恐怕得手动配上一个狗头表情。

接下来是一个几乎所有大模型都逃不过的经典测试：数一数 strawberry 里面有几个字母“r”。但网友已经和模型一起“进化”了，他们不再问 strawberry 里到底有几个字母，而是追问——为什么 AI 大模型老是数不对？

仔细观摩 o3-mini 的思考过程，会发现它坦诚地承认：“乍一看，计算 strawberry 中‘r’的数量对人类来说似乎是一件微不足道的小事，但对于许多 AI 语言模型而言，这却可能是一个惊人的挑战。”随后，它从四个不同角度分析和推理了这种现象出现的原因：

8 秒过后，o3-mini 给出了总结：AI 大模型的本质并不是为了精确、分步骤的算法操作而设计的，它们的设计和训练更侧重于根据上下文预测并生成文本，而不是执行精确的算术或系统计数。

当然，o3-mini 也不是万能的。有网友在推特上表示，他试探了 o3 关于私有 CoT 的问题，但听完一番思考推理后，发现还是如听一番思考推理——没有任何实质性进展。

一开始，o3-mini 的推理过程还算有条理，从不同种类的“内心叙事”、可解释性和实用价值等角度进行分析，指出展示完整的 CoT 过程似乎有助于“扎根”社会理解并促进更好的认知实践，但现实情况更为复杂，毕竟 AI 大模型和人类的认知尚未完全对齐。

但随着提问的深入，o3-mini 的思维链开始崩溃——急得网友团团转，中间甚至一度打开 DeepSeek-R1 来帮忙解决。他贴出了整整 12 张截图，显示 o3-mini 思考了半天，最终给出了一个令人心碎的回答。

除此之外，还有网友直接提出质疑：OpenAI 公开的，根本就不是 o3-mini 原始的 CoT 思维链。他列举了证据——同一个问题，o3-mini-high 只生成了 1384 个字符，而 o1-preview 却生成了 16577 个字符。“这只有两种可能：要么是 o3-mini-high 比 o1-preview 高效得多；要么就是 o3-mini 的 CoT 并非原始版本。”

One More Thing

对于上面这位推特网友的猜测，只能说：Bingo！猜中了！

根据 TechCrunch 的消息，OpenAI 发言人已经证实，此次公开的确实不是原始的思维链。并且给出了两个理由：其一，对原始思维链进行后处理，可以消除任何不安全的内容，并简化某些复杂的概念；其二，这样做能使非英语用户获得母语版本的思维链，带来更加友好的使用体验。

这样一来，近期被大量吐槽的 o3-mini 使用中文思考的问题，也就不再存在了。

来源：https://www.aiagiai.com/8316.html

上一篇歪果仁眼中的DeepSeek真正神奇之处究竟都有哪些 下一篇李飞飞等用1K样本16张H100训练26分钟超越o1-preview揭秘测试时缩放

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-30

企业组织级AI赋能具体实施方法

前段时间收到一位读者的留言，希望聊聊企业级、组织级的AI赋能究竟该怎么落地。巧的是，前几天刚看到一份咨询调研机构的数据：对近一两年所有企业级AI赋能项目的统计显示，超过90%的甲方企业认为，AI赋能在核心业务价值链上没有发挥任何实质性作用。除了AI辅助办公、企业智能知识库这类边缘应用起到了一些辅助效

AI教程 · 2026-06-30

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统

从事日本电商数据聚合工作时，最大的难点在于要同时应对雅虎拍卖、煤炉（Mercari）、乐天和亚马逊日本站等截然不同的平台。以往使用单机爬虫，经常出现运行中崩溃的情况——单点故障、带宽利用率不足、数据存储混乱，这三大痛点令人困扰。本文分享一套基于Scrapy + Redis的分布式爬虫方案，专门解决

AI教程 · 2026-06-30

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置

PuTTY（简称PT）是一款轻量级开源SSH Telnet客户端，凭借简洁高效的特性，多年来始终是系统管理员与开发者进行远程连接的首选利器。本教程将详细介绍PuTTY 0 81版本的完整安装过程，并指导您自定义安装路径，以便更灵活地管理SSH远程连接工具。安装准备首先需要说明的是，整个安装流

AI教程 · 2026-06-30

在线教育系统必备功能：直播课堂与题库考试架构

很多人一想到做在线教育系统，第一反应往往是先把直播间和课程播放器搭起来，觉得“能看课”就万事大吉了。真到落地那天才发现，系统能不能顺滑跑起来，关键全藏在那些细节里——课程怎么组织、学习进度怎么记、考试怎么处理、后台怎么管得住。前端看起来就几个页面，后端其实是一整条业务链路。不管你是要做在线教育APP

AI教程 · 2026-06-30

ZStack源码级AI诊断套件让故障排查秒出答案

一次故障排查，到底要花多少时间？运维人员处理私有云、虚拟化平台的问题，流程大致都是这样：先翻日志看现象，再去文档里找对应机制，然后搜社区有没有类似案例，最后综合判断给出答复。简单问题半小时，复杂问题可能要跨天——而这些时间里，大部分精力耗在了“找信息”而不是“做决策”上。类似的问题，也许每天都在