首页 游戏 软件 资讯 排行榜 专题
首页
AI
清华唐杰:解析大模型,领域研究的伪命题之困

清华唐杰:解析大模型,领域研究的伪命题之困

热心网友
23
转载
2025-12-26

编辑部 整理
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

清华教授唐杰最新在微博发表了自己关于AI的一些感悟,非常值得一读~

共八个小点,不算长篇大论,但扎实有料:

基座模型继续scaling仍然高效;真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去;Agent代表模型开始进入环境、开始形成生产力;一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项;AI终究要落到替人完成工作、创造增量价值上;领域大模型是个伪命题;

唐杰表示,发微博是想分享一下,希望对大家有用。

兹以推文刊载,供大家广泛阅读、传播。



以下为其感悟原文:

01,关于scaling基座模型

预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。

更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。

02,关于激活对齐和增强推理能力

激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用benchmark的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。

真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。

mid和post training使得更多场景的快速对齐和强推理能力成为可能。

03,关于Agent

agent是模型能力扩展的一个里程碑,也是体现ai模型进入人类真实(虚拟/物理)世界的关键。

没有agent能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。

原来的agent是通过模型应用来实现,现在模型已经可以直接将agent数据集成到训练过程,增强了模型的通用性,其实难题还是不同agent环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同agent环境的数据和针对不同环境的强化学习。

04,关于模型记忆

实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。

人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(wiki或史书)四个阶段。

大模型如何实现不同阶段的记忆是个关键,context、rag、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键,一种办法是压缩记忆,简单存在context,如果大模型可以支持足够长的context,那基本有可能实现短中长期的记忆。

但如何迭代模型知识,更改模型参数这还是个难题。

05,关于在线学习与自我评估

在线学习与自我评估。

有了记忆机理,在线学习成为一个重点,目前的大模型定时重新训练,这有几个问题:

模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;重新训练还比较浪费,同时也会丢掉很多交互数据。

因此如何实现在线学习是个关键,自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。

因此构建模型自我评价机制是个难题。

这也可能是下一个scaling范式。

continual learning/real time learning/online learning?

06,关于模型研发和应用结合

最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。

ai模型应用的第一性不应该是创造新的app,他的本质是agi替代人类工作,因此研发替代不同工种的ai是应用的关键。

c h a t部分替代了搜索,部分其实融合了情感交互。

明年将是ai替代不同工种的爆发年。

07,关于多模态和具身

写在最后的是多模态和具身。

多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到agi的智能上界,而通用agi的智能上界到底在哪儿还不知道。

可能最有效的方式还是分开发展,文本、多模态、多模态生成。

当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。

同理,如果看懂了agent就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。

那怎么办呢,采数据,或者合成数据,都不是那么容易,也贵。

但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。

当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。

2026年这些都将取得长足进步。

08,关于领域大模型和大模型应用

也讨论一下领域大模型和大模型应用。

我一直认为领域大模型就是个伪命题,都agi了哪有什么domain-specific agi……

但,agi还没实现,领域模型会长时间存在(多长,不好说,ai发展实在太快了)。

领域模型的存在本质上是应用企业不愿意在ai企业面前认输,希望构建领域know how的护城河,不希望ai入侵,希望把ai驯化为工具。

而ai的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了agi的世界。

简而言之,领域的数据、流程、agent数据慢慢的都会进入主模型。

而大模型的应用也要回到第一性原理,ai不需要创建新的应用。

ai的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。

可能就是两种,一种就是ai化以前的软件,原来需要人参与的改成ai,另一种就是创造对齐人类某个工种的ai软件,替代人类工作。

所以大模型应用需要帮助到人、创造新的价值。

如果做一个ai软件没人用,不能产生价值,那这个ai软件肯定没有生命力。

参考链接:
https://weibo.com/2126427211/5247011059141988

来源:https://www.163.com/dy/article/KHNIO6B30511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

复旦大学AI突破:视频画面几何直觉永久记忆技术解析
科技数码
复旦大学AI突破:视频画面几何直觉永久记忆技术解析

这项由复旦大学未来信息技术学院和上海创新研究院联合开展的研究发表于2026年3月的计算机视觉顶级会议论文集,论文编号为arXiv:2603 19571v1。对这一前沿技术感兴趣的读者可以通过该编号查

热心网友
03.31
京东直播新动作:刚需复杂指令与自由态数字人如何升级
AI
京东直播新动作:刚需复杂指令与自由态数字人如何升级

编辑|泽南刚刚落幕的 2026 科技界「春晚」GTC 大会上,一个全行业的共识已经形成:AI 正在进入智能体(Agent)时代。然而,当各大厂商都在疯狂入局智能体时,一个尴尬的现实却摆在面前:这些聪

热心网友
03.31
阿里Qwen3.5-Omni发布:多模态能力顶级,视频交互成新突破
科技数码
阿里Qwen3.5-Omni发布:多模态能力顶级,视频交互成新突破

全球全模态大模型竞赛迎来新变数。3月30日,阿里巴巴正式推出千问系列新一代全模态大模型Qwen3 5-Omni。这款模型在音视频理解、跨模态推理、实时交互等215项第三方评测中拿下SOTA(Stat

热心网友
03.31
阿里云Qwen3.5-Omni全模态大模型发布
科技数码
阿里云Qwen3.5-Omni全模态大模型发布

3月30日,阿里云正式发布Qwen3 5-Omni全模态大模型,这是Qwen系列最新一代产品,支持文本、图片、音频及音视频理解。该模型采用Hybrid-Attention MoE架构,Thinker

热心网友
03.31
阿里Qwen3.5-Omni发布:200余项SOTA,多模态能力领先Gemini
科技数码
阿里Qwen3.5-Omni发布:200余项SOTA,多模态能力领先Gemini

快科技3月30日消息,阿里今日正式发布千问新一代全模态大模型Qwen3 5-Omni。据悉,Qwen3 5-Omni采用混合注意力MoE架构,可实现图片、视频、语音、文字等全模态内容的输入与输出。在

热心网友
03.31

最新APP

你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29

热门推荐

崩坏星穹铁道3.4新增四星光锥怎么玩-崩坏星穹铁道3.4新增四星光锥玩法解析
游戏资讯
崩坏星穹铁道3.4新增四星光锥怎么玩-崩坏星穹铁道3.4新增四星光锥玩法解析

角色与光锥适配深度解析 为队伍挑选合适的光锥,往往能起到画龙点睛的作用。今天,我们就来深入聊聊几款功能各异的光锥,看看它们如何与特定命途的角色产生化学反应。 酣战如始 1 属性与适配角色:作为同谐命途的光锥,其核心属性集中在速度与能量恢复上。这无疑是那些专注于辅助队友、提供团队增益角色的优质选择。

热心网友
03.31
什么是加密货币对冲?如何操作?有什么优势?
web3.0
什么是加密货币对冲?如何操作?有什么优势?

什么是对冲? 加密货币市场的价格变化,向来以快速剧烈著称。上午还在上涨的资产,下午就可能面临回调。在这种高波动的环境下,交易者们自然会寻求一种方法来保护自己的资金免受冲击。这种方法就是对冲——一种旨在降低风险、提升投资组合稳定性的核心策略。简单来说,对冲的核心逻辑在于:当你持有的主要加密货币资产价值

热心网友
03.31
荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性
科技数码
荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性

荣耀平板PC化升级计划公布,将带来PC交互、PC级应用支持等特性 三月十号,荣耀的一场重磅发布会,揭开了其平板产品线战略升级的序幕。在荣耀Magic V6旗舰新品发布会后,荣耀终端股份有限公司全场景产品线的负责人,@荣耀潇哥,进一步分享了一项备受关注的“平板PC化升级计划”。 在分享中,@荣耀潇哥清

热心网友
03.31
5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图
业界动态
5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图

5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图 “没有人比我们比亚迪更懂电池。”这句在发布会上掷地有声的口号,背后是实打实的技术突破。前不久的比亚迪“闪充中国改变世界”发布会上,王传福总裁正式揭晓了第二代刀片电池与配套的闪充技术,一组数据瞬间引爆了行业: 从10%到70%电量,只需

热心网友
03.31
OPPO K15 Pro核心配置公布:明日发布,抢先了解亮点
网络安全
OPPO K15 Pro核心配置公布:明日发布,抢先了解亮点

IT之家 3 月 31 日消息,OPPO K15 Pro 系列手机已官宣将于明日 14:30 正式发布。IT之家注意到,OPPO K15 Pro 手机已现身正式,并公布了核心配置信息,IT之家附如下

热心网友
03.31