姚顺雨腾讯论文首讲:AI听不懂人话的症结何在
2月4日消息,近期,腾讯混元团队与复旦大学联合团队共同发布了一篇题为《CL-bench》的论文。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
值得关注的是,这也是姚顺雨加入腾讯、担任首席AI科学家后,首次署名发布的研究论文。
他在文中指出,当前人工智能与真正智能之间的核心差距,并非在于知识储备的多少,而在于持续学习的能力。
一个知识库庞大却不懂得学习的AI,就如同一个背下整本字典却不会写作的人,看似博学,实则思维僵化。

人类的学习并不依赖于多年前习得的“死”知识,而是能够实时地从眼前的具体情境中汲取新知并加以运用。
在这篇论文中,研究团队提到,即使是当前的大型语言模型,在有效利用上下文信息方面,依然存在显著的短板。
为了准确衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了CL-bench基准测试。
这是一个专门用于评测语言模型能否从上下文中学习新知识并正确应用的专业基准。
CL-bench包含了由资深领域专家精心制作的500个复杂上下文、1899个具体任务,以及31607个验证标准。
CL-bench只包含一个简单却严苛的核心要求:“解决每个任务时,模型必须从提供的上下文中,学习到它预训练阶段不曾具备的新知识,并将其正确应用。”
通过实验发现,全球排名前十的语言模型在CL-bench上的任务解决率平均值仅为17.2%。
这意味着,即便是目前最顶尖的语言模型,在利用上下文进行学习和推理方面,表现依然不尽人意,甚至可以说,它们还未真正掌握从动态情境中学习的能力。
不过,这一结果也为大语言模型未来的迭代指明了可能的方向:强化模型从具体上下文中进行实时学习的能力,将是迈向更高级智能的关键一步。
相关攻略
针对“AI一号位即将离职”的传言,腾讯官方已严正辟谣,称其纯属子虚乌有。传言涉及的关键人物姚顺雨现任腾讯首席AI科学家,负责AI基础设施与大语言模型部门。腾讯表示将保留追究造谣者法律责任的权利。
5月14日,一则关于腾讯AI业务“一号位”姚顺雨或将离职的传闻,在业内不胫而走。传言将离职原因指向了内部资源分配问题,称微信事业部拿走了部分算力资源。 消息发酵不久,腾讯方面便迅速作出了回应。当天下午,腾讯官方信息发布平台“鹅厂黑板报”发布文章,直接驳斥了这一说法。文章明确指出,所谓“AI一号位即将
新智元报道编辑:艾伦【新智元导读】3 月 12 日,据《白鲸实验室》独家爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026 年 4 月)发布。3 月 11 日,O
作者 | 周一笑邮箱 | zhouyixiao@pingwest com2025年4月,还在OpenAI的姚顺雨发了一篇博文《The Second Half》,提出一个判断:AI进入下半场了,接
2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。他在文中提到,当前AI与真正智能之间的鸿沟,
热门专题
热门推荐
本文梳理了2026年主流数字资产交易平台的特点与选择策略。重点从安全性、资产丰富度、交易体验、创新功能及合规性等维度进行分析,旨在帮助用户根据自身需求,在众多平台中做出明智选择,而非简单罗列排名。选择平台需综合考量资金安全、操作习惯与长期发展愿景。
本文梳理了2026年现货交易所的竞争格局,从交易深度与流动性、资产安全与合规性、用户体验与产品创新三个维度进行深度分析。文章指出,头部平台在合规与技术创新上持续领跑,新兴交易所在细分市场寻求突破,行业整体呈现出专业化、合规化与用户体验并重的发展趋势,为不同需求的用户提供了多元选择。
本文梳理了2026年主要数字资产交易平台的综合表现,从安全性、资产多样性、用户体验及创新服务等维度进行分析。榜单反映了行业向合规与专业化发展的趋势,头部平台在技术架构与风控体系上持续投入,新兴平台则凭借细分领域创新获得关注。投资者需结合自身需求,理性评估平台特点与风险。
今年四月,AI网络初创公司Aria Networks携1 25亿美元融资高调登场,并向业界抛出了一个直指核心的判断:下一阶段AI基础设施的竞争,焦点已不仅仅是堆砌更多的GPU,而在于能否构建一个能充分释放这些算力潜能的“神经网络”。 这家由前Arista和Juniper高管创立、总部位于帕洛阿尔托的
仅凭一张家用RTX 4090显卡的24GB显存,就能流畅运行一个拥有320亿参数的AI大模型,一口气读完6份长文档并自动生成周报?这并非极客魔改,而是来自MIT、英伟达与浙江大学研究者的最新突破。 这项名为TriAttention的技术,精准瞄准了大模型推理中的核心瓶颈——KV缓存显存占用。其核心思





