首页 游戏 软件 资讯 排行榜 专题
首页
AI
谷歌自家“黑科技”走红,研发团队为何毫不知情?

谷歌自家“黑科技”走红,研发团队为何毫不知情?

热心网友
62
转载
2026-01-07


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:KingHZ

【新智元导读】当整个科技圈都在为「谷歌黑魔法」集体高潮时,真相恐给了所有人一记耳光。那套被捧上神坛的「并行验证循环」,不过是社交网络上AI生成的「赛博跳大神」。

如果说之前的AI模型是在模拟人类的思考,那么Gemini 3 Flash就是在模拟人类的「直觉」。

3倍于Gemini 2.5 Pro的速度,却拥有超越Pro级的推理能力。

更离谱的是,它的智力竟然在某些基准测试超越了自家的Pro大哥。


但目前为止,依然没人能说明白:Flash凭为什么比Pro还要「聪明」。

谷歌DeepMind到底有啥黑魔法?

「林子打了,什么鸟都有」,以至于X上网友Jainam Parmar爆料:

AlphaGo团队根本不使用思维链。

他们采用并行验证循环机制。

这套方法正在碾压你听说过的所有「高级推理」技术。


成千上万的网友浏览过这个帖子。

这靠谱吗?这有没有可能是「以讹传讹」、用AI生成的「假新闻」?

如果是假新闻,难道只是因为「DeepMind碾压同行的推理」这样的噱头吗?


我们先看一下推文到底讲了啥。

谷歌DeepMind的黑科技?

首先,这位「万能的网友」直击CoT命门,解释了为什么Chain-of-Thought很糟糕。

当前的AI推理是线性的:

思考步骤1→步骤2→步骤3。

但这并不是专家级问题解决者的思维方式。

然后,他写道:「DeepMind分析了他们的AlphaGo团队是如何应对复杂问题的,结果发现了一件非常惊人的事情。」


并行验证循环(Parallel Verification Loops):

专家型思考者并不会沿着一条冗长的推理链一路走到底,而是同时运行多个验证循环。

他们会提出一个解决方案,用约束条件去检验它;必要时回退;同时探索其他可能的路径——这些过程是并行发生的。

而Chain-of-Thought做不到这一点。


架构上的差异(The ArchitectureDifference):

传统的思维链:A→B→C→D(线性)

DeepMind的框架:A→[B1,B2,B3]→分别验证→精炼→迭代

这就好比是在一条路上一直往前走,而另一种方式则是同时探索整棵决策树。


结果非常夸张:

在复杂推理基准测试中:

相比标准的Chain-of-Thought,性能提升37%

捕捉逻辑错误的能力提升52%

收敛到正确解的速度快了3倍

这不是小幅优化,而是架构层面的飞跃。


它实际是如何运作的:

步骤1:同时生成多个候选解决方案

步骤2:每个方案各自运行一套验证循环

步骤3:不同方案之间进行交叉验证

步骤4:剪除较弱的分支,强化更有潜力的路径

步骤5:持续迭代,直到收敛


自我纠错优势:

这才是杀手级特性:系统在给出最终答案之前,就能发现并纠正自己的错误。

传统的CoT(思维链)是按步骤顺序「提交」的,只要其中一步出错,后面就全盘皆输。

而并行验证允许在不中断整体流程的情况下回溯和修正,而不必从头再来。


对训练方式的影响:

他们不只是测试了这种方法,而是直接用这一框架来训练模型。

模型学会了:

提出多个假设

让这些假设相互检验

通过验证逐步建立置信度

尽早剪除错误或低质量的推理路径


现实世界中的应用:

这一框架在以下场景中表现尤为强大:

数学证明(一步出错,整体就会崩塌)

代码调试(可能同时存在多个潜在Bug)

战略规划(需要探索复杂的决策树)

科学推理(假设提出与验证)

凡是正确性优先于速度的地方,它都具备压倒性优势。


如果你正在构建AI智能体或推理系统,Chain-of-Thought已经过时了。

未来属于并行验证(Parallel Verification)。

生成多条路径。

对它们进行测试。

让最优解自然浮现。

这正是AlphaGo击败世界冠军的方式。

这也是推理真正运作的方式。

疑点重重,被AI袭击的一天?

在这些描述中,「并行验证」简直就是为数学证明和代码调试量身定制的终极武器。

凡是追求正确性的场景,它似乎都能实现降维打击。

这套理论听起来是不是太完美了?简直就像是DeepMind真的把人类直觉代码化了一样。

但恰恰是这种「过度的完美」和「极具煽动性」的文风,引起了业内人士的警觉。

当成千上万的网友还在为这套「黑魔法」转发点赞时,冷静下来的人们开始追问一个最基本的问题:

这套东西,到底是谁说的?

发帖的Jainam Parmar,也不是什么AI研究领域的大牛,也不是谷歌DeepMind的员工。

他也没有明确给出DeepMind的可信的源链接。

他说的靠谱吗?

即使DeepMind放缓发布世界知名的研究成果,以便在AI竞赛中赢得先机。


但DeepMind仍在发布他们的研究成果。


去年11月初,谷歌DeepMind团队还发布了号称解决「可持续学习」难题的新的机器学习范式──嵌套学习(nested learning)。


原推文那种藏头露尾、吊人胃口的写作风格,令人不喜,甚至部分网友怀疑,帖子压根就是大模型生成的!


熟悉DeepMind研究工作的网友,则认为帖子在故弄玄虚,甚至歪曲原意!



更有网友毫不客气地指出,发帖人就是蹭热度,半年前他还在鼓吹「CoT就是下一代推理技术」。




还有更关键的证据,之后,另一网友Chris Laub发布了一模一样的内容:


帖子底下,也有网友怀疑,这就是诱导人点击的AI垃圾!




事实上,CoT早不是什么先进技术。

长思维链和短思维链截然不同。

长思维链,有三大关键特征: 深度推理、广泛探索和可行的反思。

这些特征使得模型能够处理更复杂的任务,并且与较浅的短思维链相比,产生更高效、更连贯的结果。


回到问题本身:Gemini 3Flash 到底凭什么更聪明?

至少目前,没有任何可靠证据表明DeepMind已将「并行验证循环」作为核心推理框架,全面取代Chain-of-Thought。

相反,这场风波更像一次典型的 AI 舆论实验—— 当模型表现出现异常跃迁,人们总是更愿意相信「黑魔法」,而不是渐进式优化。

真正值得警惕的,也许不是CoT是否过时,而是我们是否过度迷信单一解释。

推理的未来,未必只有一条路,但谣言,往往只需要一条推文。

参考资料:

https://github.com/LightChen233/Awesome-Long-Chain-of-Thought-Reasoning

https://x.com/iruletheworldmo/status/2007550905177256071

https://x.com/aiwithjainam/status/2005629090943193552

https://x.com/ChrisLaubAI/status/2006668516280197287

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

来源:https://www.163.com/dy/article/KIMGI8TG0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌 TurboQuant 算法遭质疑,中国博士后指其论文存在严重问题
业界动态
谷歌 TurboQuant 算法遭质疑,中国博士后指其论文存在严重问题

谷歌TurboQuant算法遭中国博士后质疑,论文争议点深度剖析 近日,AI模型压缩领域发生了一场引人关注的学术风波。事件的起因是谷歌研究院在3月25日重磅发布的全新极端压缩算法TurboQuant。该技术旨在破解大语言模型推理过程中的核心瓶颈——键值缓存(KV Cache)所导致的庞大内存占用问题

热心网友
04.01
OpenAI再上演资产大逃亡:别等ASI,模型已成流量诱饵
AI
OpenAI再上演资产大逃亡:别等ASI,模型已成流量诱饵

新智元报道编辑:倾倾【新智元导读】全世界都在等ASI降临,OpenAI却在年初悄悄上线广告位。9亿用户撑不起数百亿美元的算力账单,智力正在贬值,神仙也得下凡赚钱!2025年底,一份名为ChatGPT

热心网友
04.01
谷歌 Willow 量子处理器开放限量早期试用,加速商业化进程
业界动态
谷歌 Willow 量子处理器开放限量早期试用,加速商业化进程

谷歌Willow量子处理器启动限时早期访问,加速商业应用落地 近期,谷歌在量子计算领域的连续动作引发了业界广泛关注,其商业化节奏明显提速。从中性原子计算路径的探索,到后量子加密技术部署时间表的提前,一系列进展均显示出强烈的推进意图。而最新发布的 Willow 量子处理器限量早期访问计划,更被视为其从

热心网友
04.01
谷歌为 Pixel 10 等手机酝酿通勤模式:过滤通知、切换音频等
科技数码
谷歌为 Pixel 10 等手机酝酿通勤模式:过滤通知、切换音频等

谷歌 Pixel 手机将推“通勤模式”:智能优化公共交通出行体验 科技领域的最新动向显示,谷歌即将为其 Pixel 智能手机引入一项备受期待的新功能——“通勤模式”(Transit Mode)。该功能旨在深度优化用户在乘坐地铁、公交等公共交通工具时的手机使用体验,帮助乘客在嘈杂或拥挤的环境中更好地管

热心网友
04.01
谷歌翻译AI外语外教实测:每日学习督导机制详解
手机教程
谷歌翻译AI外语外教实测:每日学习督导机制详解

12 月 9 日消息,科技媒体 Android Authority 今天(12 月 9 日)发布博文,通过拆解谷歌翻译(Google Translate)安卓版 v9 29 安装包代码,发现了多项

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《洛克王国》世界圣羽翼王打法攻略-圣羽翼王技能与实战详解
游戏攻略
《洛克王国》世界圣羽翼王打法攻略-圣羽翼王技能与实战详解

速览攻略:世界圣羽翼王核心打法与全面解析 本攻略将为你完整呈现《洛克王国》世界圣羽翼王的通关秘籍,深度剖析两种高效实战打法:追求极致速度的“燃薪虫四回合速通”与稳定输出的“酷拉无限连击流”。文章将进一步解析这位翼系精灵王的技能机制、属性克制关系及其在PVE与PVP中的实战定位,帮助你彻底掌握应对其隐

热心网友
04.06
《异种航员2》工程系统详解-工作坊与资源管理指南
游戏攻略
《异种航员2》工程系统详解-工作坊与资源管理指南

速览:工程系统核心机制解析 在《异种航员2》中,工程系统是整个抵抗力量赖以运转的“战略后勤中枢”。无论是研发新武器、生产重型装甲还是制造先进飞行器,所有实体装备的产出都依赖于此。简言之,该系统的核心运作围绕着两大关键:工程师人力的高效配置与全球稀缺资源的精细化调度。工程师的数量直接决定了每个项目的建

热心网友
04.06
《洛克王国世界》治愈兔位置详解-任务与战斗关键精灵
游戏攻略
《洛克王国世界》治愈兔位置详解-任务与战斗关键精灵

核心速览 在《洛克王国世界》中,治愈兔是一位兼具功能性任务角色与实战辅助能力的精灵。它的价值不仅在剧情推进中体现,更在于对战里出色的治疗与防护表现。本文将为你全面解析治愈兔的精准获取位置、种族属性特点以及实战技能搭配,助你顺利捕捉并最大化其在队伍中的作用。所有关键信息将通过清晰的图文内容详细展示,确

热心网友
04.06
《红色沙漠》传说之狼打法-传说之狼击杀流程详解
游戏攻略
《红色沙漠》传说之狼打法-传说之狼击杀流程详解

速览 在《红色沙漠》中,挑战传说之狼这一强大的任务BOSS,需要玩家进行充分的准备并遵循完整的任务流程。整个过程环环相扣,你必须首先参与塞莱斯特家族的势力任务,通过完成任务将家族声望提升至指定等级,才能解锁【传说之狼】的专属讨伐任务,最终直面这个传说中的强大生物。 红色沙漠传说之狼怎么打 归根结底,

热心网友
04.06
《宝可梦Pokopia》舒适度提升攻略-环境等级与栖息地优化指南
游戏攻略
《宝可梦Pokopia》舒适度提升攻略-环境等级与栖息地优化指南

【宝可梦Pokopia】舒适度全解析:快速提升环境等级的核心秘诀 你是否正在探索《宝可梦Pokopia》世界,并希望有效提升宝可梦栖息地的舒适度?舒适度不仅是衡量宝可梦快乐程度的晴雨表,更是解锁游戏核心内容、加速发展的关键驱动指标。本攻略将系统性地为你揭示提升舒适度的核心途径,涵盖从装饰栖息地、建造

热心网友
04.06