姚顺雨第一次肉身亮相完整回顾总结

时间：2026-06-07 13:02

腾讯云AI下半场大会上，姚顺雨指出竞争焦点从模型能力转向真实场景、产品反馈与Agent工程落地。他强调上下文、信任及产品反馈的关键作用，认为AI是长期多元游戏，腾讯正以模型与产品Co-Design思路推进内部重组。

6月5日，腾讯云AI下半场大会上，腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨进行了一场深度对谈，信息量不小。

这场对话的核心，其实是围绕着一个问题：当大模型的方法论趋于成熟，接下来的竞争焦点到底在哪里？结论很清晰——重点正从单纯的模型能力比拼，转向真实场景、产品反馈、上下文网络以及Agent的工程落地。这背后，透露出腾讯内部正在以“模型与产品Co-Design”为思路，对自身进行一次深刻的重组。

我们梳理了两位大佬的全部谈话，提炼出以下15个核心观点，希望能帮你更清晰地把握AI下半场的脉搏。

A. 关于AI下半场

1. “下半场”这个词被滥用了，姚顺雨加入腾讯，是因为这里有“好问题”

姚顺雨直言，“AI下半场”这个概念有些被用烂了。他打了个比方：过去几十年，AI更像是在寻找“好方法”，比如为了围棋做AlphaGo，为了翻译做特定模型。但预训练和后训练成熟后，大模型变成了一把“万能的锤子”，什么都能敲两下。于是，真正稀缺的东西变了，变成了“好问题”——也就是到底该把这锤子往哪里敲，解决什么问题，才能产生价值。

这恰恰是他选择加入腾讯的原因。“腾讯有很多好的问题，有很多很多产品。”好的产品能解决第一个难题：当技术准备好后，你究竟要用它去做什么，它的价值究竟在哪。这才是最关键的。

2. 环境重要，但“上下文”更重要，竞争壁垒有时就来自你有没有那第一手的输入

姚顺雨特别强调了“环境”（Environment）的重要性。没有环境，Agent就像没有土壤的植物，什么事也干不了。比如，没有点外卖的工具，它就没办法帮你点外卖。

但比环境更重要的，是“上下文”（Context）。在他看来，无论是企业还是个人，Context的分量会越来越重。因为模型本身已经非常擅长把复杂的输入变成输出，很多时候，你的竞争壁垒就取决于你有没有最原始的输入——比如，你知不知道这个用户此刻在干什么，你知不知道这家企业的各种内部信息。这一点，腾讯的生态优势就体现出来了。

3. AI下半场最重要的目标，是在中国建立一个长期、均衡的AGI组织

姚顺雨个人的目标很明确：在中国建立一个能长期发展的、基于AGI的组织。他把今天的AI工作分成了三大块：

第一是基础部分，把预训练和后训练这些最底层的技术做扎实。这需要充足资源和正确的方法论。第二是产品，怎么把技术真正转化成对社会和人有价值的服务。这需要有良好产品直觉的人。第三是前沿探索，去开拓新的研究范式和新机会。他认为，在中国，这一点特别需要加强。

这三者的关系，就像一个等边三角形，必须均衡发展，构建一个能持续进化的组织。

4. 腾讯追求模型与产品Co-Design，但一切的前提是模型本身要硬

谈到腾讯内部高频提到的Co-Design，姚顺雨的观点非常务实：一切合作的前提，是模型本身要做得足够扎实。预训练阶段是相对普适的，目标是为所有下游任务提供一个可泛化的基础。而后训练阶段，最重要的就是设立正确的评估体系（Eval）。

他吐槽了一个国内不太好的倾向：刷榜。大家更应该关心的是，如何实事求是地基于真实的产品和应用，去构建更真实的评估体系。实用性的价值，远比刷榜的数字要大。腾讯在这方面做了大量工作，与各类产品进行深度Co-Design。他强调，Co-Design最关键的一点是建立“信任”，这需要大量细致的功夫去磨合，比如怎么把产品的数据回流好，怎么把评估体系做好。

5. 真实产品的反馈，能发现benchmark永远看不到的问题

姚顺雨并不否认benchmark的价值，但他认为，真实世界的数据至少有三类无可替代的价值：

第一，发现榜单无法暴露的底线问题。腾讯在发布预览版模型时，最重要的目的之一就是获取真实反馈，修复各种榜单中根本测不出的“低级错误”。第二，理解真实用户的提问模式。现实中的用户提问往往是模糊、短促、且会不断追问的，这和benchmark里那种精确、单轮的问题完全不同。理解这种差异，对优化训练方式启发巨大。第三，产品本身还能启发全新的评测方向，推动我们去定义那些还没有被很好定义的能力。比如，腾讯近期在上下文学习上的很多工作，就受到了元宝产品反馈的巨大启发。

B. 关于模型泛化

6. 以模型之名，腾讯旗下不同的产品终于有了“互相流通”的感觉

姚顺雨点出了一个根本性的变化：大语言模型（LLM）时代与以往AI最大的不同，在于“泛化性”。以前做翻译模型，只需要翻译数据；做围棋模型，只需要围棋数据。但现在，哪怕你只想做一个Coding Agent，它也必须同时具备聊天、搜索、指令遵循、推理等多种能力。

这意味着，拥有多个产品场景的公司将拥有体系化优势。比如，和元宝的Co-Design，让模型获得了强大的聊天和搜索能力，这种能力是可以被迁移到ima、WorkBuddy等其他产品中的。各个产品贡献不同的数据，这些数据又能相互扩散、相互增强，最终形成一个网络状的体系，价值会越来越大。这与此前腾讯“赛马”式的打法形成鲜明对比，某种程度上，AI正成为打破部门墙的粘合剂。

7. Hy3的核心变化：重建基础设施、重做数据，再加上大量“品味驱动”的决策

对于混元Hy3 Preview，姚顺雨坦言“大模型没什么秘密”。核心就是三件事：把基础设施（Infrastructure）做好，把数据做好，而算法部分反而相对简单。混元3主要做了几方面改变：一是完全重建了预训练和强化学习的基础设施；二是在数据上下了大功夫，包括定义更真实的问题、丰富数据分类体系、提高数据质量；三是，很多关键决策并没有清晰的公式可循，从招人到模型研发节奏、到资源取舍，本质上是一个高度依赖于“品味”（Taste）的决策过程。

8. 元宝与混元的合作，最难的不是技术，而是“信任”

姚顺雨透露了一个细节：在元宝早期，混元团队曾派出很强的算法骨干去帮助元宝先把DeepSeek的后训练做好。当时混元自己的预训练模型还没Ready，很多同学不理解为什么要这么做。但他认为，维护好元宝这样的产品和日活，对后续做模型和长期合作都至关重要。事实证明，这些努力没有白费。这个“牺牲”的动作，让产品和模型的同事都意识到，模型团队是真心在为产品着想。这为后续混元模型在元宝的成功上线，建立了非常重要的信任基础。他总结道，模型和产品团队的目标虽然有大量重合，但也有很多不重合的地方，天然会有矛盾。解决之道不是技术，而是换位思考的能力，是建立信任。

9. AI时代做产品的范式变了：从“预制菜”变成了“开放式厨房”

汤道生认为，做产品的第一性原理没变，依然是解决用户的根本痛点。但实现方式完全不同了。在AI时代以前，做产品就像做“预制菜”，产品方想好所有功能，做成菜单让用户选。但在AI时代，产品变成了一个开放式服务。用户可能只用一句自然语言或语音提出需求，你不知道他会问什么。这就要求产品充分利用模型的推理和工具调用能力，去理解并满足这种开放式的需求。

他提到，今年大部分代码可能都由AI生成。工程师的精力将更多转向架构设计，然后把写代码的苦活交给AI，自己负责指导和修正。测试工作也要前置，想好各种场景下的应对方案。这都让对能力的要求变得更全面、更复杂。

10. 姚顺雨的博士论文，2019年就预见了今天，但他觉得自己“还是不够大胆”

姚顺雨分享说，他重新读了自己2019年的博士论文《Language Agent: from Next Token Prediction to Digital Automation》，感觉像是回到了远古时代。当时GPT-2刚出来，还在做下一个Token预测，生成的文本还不连贯。但他当时就觉得，“预测下一个Token”这个行为极其优美和通用，它未来的潜力绝不只是“吐下一个Token”，而是把世界上所有的事情自动化。他博士期间做的开创性工作，比如React和SWE-bench，都是在探索如何把一个“预测Token的机器”变成一个能自动做事的Agent。

他回忆，当第一次将Palm 2 API和Wikipedia API连接起来，看到模型能基于网页回答问题时，感觉“就像微弱的电灯丝突然亮了”。他当时觉得这可能在5到10年内改变世界，但现实比他想象的更快。他感慨道，看论文结尾的future work部分，现在自己确实在做当时规划的方向，但“可能想的还是不够大，当时已经觉得自己想的够大了”。

C. 关于Agent

11. Agent与Coding Agent，已成为所有模型公司的基础能力

姚顺雨认为，Agent，尤其是Coding Agent，已经像预训练一样，变成了每家模型公司不得不做的“基本功”。Coding Agent之所以如此本质，是因为当模型能控制文件系统、拥有容器时，它就已经接近一个完整的系统。但他强调，要把Coding Agent做好，需要的远不止编程数据，还需要聊天、搜索、推理等综合能力。腾讯的做法会更强调体系的全面化，以及对线上回流的利用和新技术范式的探索。这需要想象力，要做好即使今天Coding Agent最重要，也要为未来做储备的准备。

12. 性价比的核心是“性能”，一次把简单任务做对，比纠结模型架构更重要

面对市场对Token成本的焦虑，姚顺雨提出了一个核心观点：性价比，性能（performance）是第一位的。他用一个反直觉的现象说明：很多人发现，用更强的模型反而更省钱，因为它能一次性把事情做对，节省了人力。尤其今年，许多简单任务的鲁棒性变得至关重要。如何用一个模型一次性、可靠地完成大量的简单任务，这可能是提升性价比更关键的部分，而不是单纯纠结于模型架构。

当然，成本也很重要。他认为中国在成本优化上是领先于世界的，腾讯也做了大量工作。他个人判断，如果能做一个相对较小的模型，同时又能比肩大模型的性能，并且在大部分任务上做到很强的鲁棒性，这比在长程任务上提升一两个百分点，可能在中国市场更有价值。

13. 不同场景的Agent需要不同的“上下文”，这正是腾讯的优势所在

汤道生指出，腾讯针对不同场景，设计了不同的Agent形态。其核心思路是“赋能”：模型能力越强，Agent需要做的工作就越少。产品要做的是为模型提供更多、更精准的工具（Skills）和记忆（Context）。比如，在Coding环境下提供代码库上下文，在办公协作场景下提供过往PPT风格和内容偏好。理解场景中什么信息是“相关的”、“重要的”，并把这些Context精准地喂给模型，这才是设计Agent的关键。

14. AI时代的产品组织要更扁平，每个工程师都是产品经理

汤道生观察到一个有趣的现象：他帮WorkBuddy看组织发文时，发现团队非常扁平，3-5人的小团队就围绕一个领域攻坚。这种组织形态支持大量试验，并允许失败。因为试验大部分拿不到正向反馈，所以必须包容试错。

此外，他预测工程师的角色将发生根本性变化。当写代码的工作被AI取代后，每个工程师都会更像一个“有想法的领导者”，驱动多个Coding Agent。同时，他们也要深度参与产品设计、评测和质量保证工作，用户需求的理解能力变得前所未有的重要。

15. 回应“腾讯AI慢了”：下半场才刚刚开始，AI会是长期且多元的游戏

对于外界“腾讯慢了”的声音，姚顺雨给出了两个判断。

第一，AI是一场马拉松，不是百米冲刺。他不认为ChatGPT和Claude Code会是唯一的Super App，那是一个“灰暗的世界”。他相信未来会有源源不断的新机会诞生，就像70年代的PC刚刚诞生时一样。第二，AI的未来会走得更“多元”，而不是沿着单一主线前进。Coding Agent固然重要，但多模态、具身智能等大量空间还未被填满。从这个角度看，下半场才刚刚开始。

他也坦诚，过去走过弯路很正常，重要的是能否诚实地面对反馈并做出改变，以及能否保持耐心。汤道生也补充说，在一个复杂的组织里，有快有慢很正常。但就像姚顺雨说的，这是一个长期游戏，腾讯丰富的场景、海量的产品和积累的“上下文”，都是未来长跑中最大的底气。

来源：https://www.163.com/dy/article/KUM08FF705399DAP.html

姚顺雨

上一篇金山办公推出WPS笔记，AI贯穿记录到复用全流程 下一篇俞浩微博被禁言，地方摸排企业与追觅合作，当地回应

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。