游乐游手机版
首页/科技数码/文章详情

张祥雨:Transformer架构如何助力AI智能体发展

时间:2025-12-18 21:01
“Transformer完全不能支撑我们下一步,尤其是在Agent时代走向下一步。”12月18日,90后AI大牛、阶跃星辰首席科学家张翔雨公布了自己最新的研究结论,直指当前AI领域核心架构Trans

“Transformer架构已经无法承载我们走向下一步,尤其是在迈向Agent时代的关键阶段。”12月18日,90后AI领域顶尖学者、阶跃星辰首席科学家张翔雨公开了他最新的研究观点,直言当前AI领域的核心架构Transformer正面临技术瓶颈。

Transformer架构是当前人工智能,特别是生成式AI与大语言模型的基石。它于2017年由谷歌团队在论文《Attention Is All You Need》中提出,其核心创新在于“自注意力机制”,有效突破了传统循环神经网络(RNN)在处理长序列时的局限。可以说,没有Transformer,就没有今天ChatGPT、Gemini等标志性模型的出现。

张翔雨是深度学习领域的知名学者,以在残差网络(ResNet)方面的开创性工作而闻名。此前他与合作者完成的论文《Deep Residual Learning for Image Recognition》曾获CVPR最佳论文奖,引用次数已超20万次,是计算机视觉与模式识别领域被引用最多的论文之一。


张翔雨首先承认,当前大模型行业看似进入了一个“稳态”时期,各类创新的模型架构最终都收敛到以Transformer为核心的各种变体上。针对长上下文处理效率的瓶颈,业界通过如线性注意力、稀疏注意力等技术手段进行“小修小补”,但这并未改变Transformer本质的建模能力局限。

“但是我们很快发现了一个巨大的副作用。”张翔雨表示,真正的难点在于模型的智商会随着文本长度快速增加而急剧下降。“今天的Transformer,无论宣称支持多少Token,基本上超过8千个就不可用了。”

这个问题指向了Transformer的一个根本缺陷,即其单向信息流的设计。无论输入序列多长,模型的有效“思考深度”只能从浅层向深层单向传递,缺乏从深层向浅层的反馈与压缩机制,这与人类大脑“无限流”的记忆机制存在本质差异。

“我今天讲过的每一句话,都是历史上我见过的所有信息的函数。”张翔雨用比喻阐明,“这个函数能用层数固定的网络来表示吗?肯定不可以。”他说人类大脑能够对从小到大的海量经历进行动态压缩和选择性回溯,而当前Transformer结构无法实现这种类似“无限流”世界的智能处理需求,这制约了AI向具备高度自主性、能长期持续学习的通用Agent演进。

事实上,当前已经开始有研究者探讨Transformer是否存在根本局限性。就在今年10月,Transformer架构的共同创造者Llion Jones在TED AI大会上表示自己已经受够了Transformer,并开始寻找下一次重大突破。他直言尽管现在AI领域投入了前所未有资金与人才,但研究者却变得越来越狭隘,他们更倾向于利用现有架构而非探索新路径,“错过下一个重大突破的风险正在加剧。”

挑战已经出现。Mamba、TTT等新型架构正吸引越来越多目光。英伟达、Meta、腾讯等巨头已在探索将Mamba与Transformer融合;中国科学院自动化所与沐曦合作研发的类脑脉冲大模型“瞬时1.0”,则展示了构建非Transformer架构生态的可行性。

张翔雨透露,阶跃星辰团队已经在探索新的架构方向,一些小规模实验已取得积极结论。他认为,未来的架构是基于非线性递归网络的全新设计。但他也坦言,这种架构革新将给系统效率和可并行度带来巨大挑战,需要软硬件协同设计才能落地。

来源:https://www.163.com/dy/article/KH35PQ8J0519DDQ2.html
上一篇OpenAI成版权被告大户,但权利人诉讼并非唯一选择 下一篇新华网科技观察:6G与AI融合将如何重塑未来?
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5

电动汽车电池新国标7月实施热失控不起火不爆炸
科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起,两项关乎电动汽车安全的核心强制性国家标准将正式实施,为行业加装“安全锁”——《电动汽车安全要求》(GB 18384-2025)与《电动汽车用动力蓄电池安全要求》(GB 38031-2025)同步落地。此次标准升级,从整车架构与电池系统两大维度,精准填补了近年来多起事故暴露出的