6月5日,腾讯云AI下半场大会上,腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨进行了一场深度对谈,信息量不小。
这场对话的核心,其实是围绕着一个问题:当大模型的方法论趋于成熟,接下来的竞争焦点到底在哪里?结论很清晰——重点正从单纯的模型能力比拼,转向真实场景、产品反馈、上下文网络以及Agent的工程落地。这背后,透露出腾讯内部正在以“模型与产品Co-Design”为思路,对自身进行一次深刻的重组。

我们梳理了两位大佬的全部谈话,提炼出以下15个核心观点,希望能帮你更清晰地把握AI下半场的脉搏。
A. 关于AI下半场
1. “下半场”这个词被滥用了,姚顺雨加入腾讯,是因为这里有“好问题”
姚顺雨直言,“AI下半场”这个概念有些被用烂了。他打了个比方:过去几十年,AI更像是在寻找“好方法”,比如为了围棋做AlphaGo,为了翻译做特定模型。但预训练和后训练成熟后,大模型变成了一把“万能的锤子”,什么都能敲两下。于是,真正稀缺的东西变了,变成了“好问题”——也就是到底该把这锤子往哪里敲,解决什么问题,才能产生价值。
这恰恰是他选择加入腾讯的原因。“腾讯有很多好的问题,有很多很多产品。”好的产品能解决第一个难题:当技术准备好后,你究竟要用它去做什么,它的价值究竟在哪。这才是最关键的。
2. 环境重要,但“上下文”更重要,竞争壁垒有时就来自你有没有那第一手的输入
姚顺雨特别强调了“环境”(Environment)的重要性。没有环境,Agent就像没有土壤的植物,什么事也干不了。比如,没有点外卖的工具,它就没办法帮你点外卖。
但比环境更重要的,是“上下文”(Context)。在他看来,无论是企业还是个人,Context的分量会越来越重。因为模型本身已经非常擅长把复杂的输入变成输出,很多时候,你的竞争壁垒就取决于你有没有最原始的输入——比如,你知不知道这个用户此刻在干什么,你知不知道这家企业的各种内部信息。这一点,腾讯的生态优势就体现出来了。
3. AI下半场最重要的目标,是在中国建立一个长期、均衡的AGI组织
姚顺雨个人的目标很明确:在中国建立一个能长期发展的、基于AGI的组织。他把今天的AI工作分成了三大块:
第一是基础部分,把预训练和后训练这些最底层的技术做扎实。这需要充足资源和正确的方法论。第二是产品,怎么把技术真正转化成对社会和人有价值的服务。这需要有良好产品直觉的人。第三是前沿探索,去开拓新的研究范式和新机会。他认为,在中国,这一点特别需要加强。
这三者的关系,就像一个等边三角形,必须均衡发展,构建一个能持续进化的组织。
4. 腾讯追求模型与产品Co-Design,但一切的前提是模型本身要硬
谈到腾讯内部高频提到的Co-Design,姚顺雨的观点非常务实:一切合作的前提,是模型本身要做得足够扎实。预训练阶段是相对普适的,目标是为所有下游任务提供一个可泛化的基础。而后训练阶段,最重要的就是设立正确的评估体系(Eval)。
他吐槽了一个国内不太好的倾向:刷榜。大家更应该关心的是,如何实事求是地基于真实的产品和应用,去构建更真实的评估体系。实用性的价值,远比刷榜的数字要大。腾讯在这方面做了大量工作,与各类产品进行深度Co-Design。他强调,Co-Design最关键的一点是建立“信任”,这需要大量细致的功夫去磨合,比如怎么把产品的数据回流好,怎么把评估体系做好。
5. 真实产品的反馈,能发现benchmark永远看不到的问题
姚顺雨并不否认benchmark的价值,但他认为,真实世界的数据至少有三类无可替代的价值:
第一,发现榜单无法暴露的底线问题。腾讯在发布预览版模型时,最重要的目的之一就是获取真实反馈,修复各种榜单中根本测不出的“低级错误”。第二,理解真实用户的提问模式。现实中的用户提问往往是模糊、短促、且会不断追问的,这和benchmark里那种精确、单轮的问题完全不同。理解这种差异,对优化训练方式启发巨大。第三,产品本身还能启发全新的评测方向,推动我们去定义那些还没有被很好定义的能力。比如,腾讯近期在上下文学习上的很多工作,就受到了元宝产品反馈的巨大启发。
B. 关于模型泛化
6. 以模型之名,腾讯旗下不同的产品终于有了“互相流通”的感觉
姚顺雨点出了一个根本性的变化:大语言模型(LLM)时代与以往AI最大的不同,在于“泛化性”。以前做翻译模型,只需要翻译数据;做围棋模型,只需要围棋数据。但现在,哪怕你只想做一个Coding Agent,它也必须同时具备聊天、搜索、指令遵循、推理等多种能力。
这意味着,拥有多个产品场景的公司将拥有体系化优势。比如,和元宝的Co-Design,让模型获得了强大的聊天和搜索能力,这种能力是可以被迁移到ima、WorkBuddy等其他产品中的。各个产品贡献不同的数据,这些数据又能相互扩散、相互增强,最终形成一个网络状的体系,价值会越来越大。这与此前腾讯“赛马”式的打法形成鲜明对比,某种程度上,AI正成为打破部门墙的粘合剂。
7. Hy3的核心变化:重建基础设施、重做数据,再加上大量“品味驱动”的决策
对于混元Hy3 Preview,姚顺雨坦言“大模型没什么秘密”。核心就是三件事:把基础设施(Infrastructure)做好,把数据做好,而算法部分反而相对简单。混元3主要做了几方面改变:一是完全重建了预训练和强化学习的基础设施;二是在数据上下了大功夫,包括定义更真实的问题、丰富数据分类体系、提高数据质量;三是,很多关键决策并没有清晰的公式可循,从招人到模型研发节奏、到资源取舍,本质上是一个高度依赖于“品味”(Taste)的决策过程。
8. 元宝与混元的合作,最难的不是技术,而是“信任”
姚顺雨透露了一个细节:在元宝早期,混元团队曾派出很强的算法骨干去帮助元宝先把DeepSeek的后训练做好。当时混元自己的预训练模型还没Ready,很多同学不理解为什么要这么做。但他认为,维护好元宝这样的产品和日活,对后续做模型和长期合作都至关重要。事实证明,这些努力没有白费。这个“牺牲”的动作,让产品和模型的同事都意识到,模型团队是真心在为产品着想。这为后续混元模型在元宝的成功上线,建立了非常重要的信任基础。他总结道,模型和产品团队的目标虽然有大量重合,但也有很多不重合的地方,天然会有矛盾。解决之道不是技术,而是换位思考的能力,是建立信任。
9. AI时代做产品的范式变了:从“预制菜”变成了“开放式厨房”
汤道生认为,做产品的第一性原理没变,依然是解决用户的根本痛点。但实现方式完全不同了。在AI时代以前,做产品就像做“预制菜”,产品方想好所有功能,做成菜单让用户选。但在AI时代,产品变成了一个开放式服务。用户可能只用一句自然语言或语音提出需求,你不知道他会问什么。这就要求产品充分利用模型的推理和工具调用能力,去理解并满足这种开放式的需求。
他提到,今年大部分代码可能都由AI生成。工程师的精力将更多转向架构设计,然后把写代码的苦活交给AI,自己负责指导和修正。测试工作也要前置,想好各种场景下的应对方案。这都让对能力的要求变得更全面、更复杂。
10. 姚顺雨的博士论文,2019年就预见了今天,但他觉得自己“还是不够大胆”
姚顺雨分享说,他重新读了自己2019年的博士论文《Language Agent: from Next Token Prediction to Digital Automation》,感觉像是回到了远古时代。当时GPT-2刚出来,还在做下一个Token预测,生成的文本还不连贯。但他当时就觉得,“预测下一个Token”这个行为极其优美和通用,它未来的潜力绝不只是“吐下一个Token”,而是把世界上所有的事情自动化。他博士期间做的开创性工作,比如React和SWE-bench,都是在探索如何把一个“预测Token的机器”变成一个能自动做事的Agent。
他回忆,当第一次将Palm 2 API和Wikipedia API连接起来,看到模型能基于网页回答问题时,感觉“就像微弱的电灯丝突然亮了”。他当时觉得这可能在5到10年内改变世界,但现实比他想象的更快。他感慨道,看论文结尾的future work部分,现在自己确实在做当时规划的方向,但“可能想的还是不够大,当时已经觉得自己想的够大了”。
C. 关于Agent
11. Agent与Coding Agent,已成为所有模型公司的基础能力
姚顺雨认为,Agent,尤其是Coding Agent,已经像预训练一样,变成了每家模型公司不得不做的“基本功”。Coding Agent之所以如此本质,是因为当模型能控制文件系统、拥有容器时,它就已经接近一个完整的系统。但他强调,要把Coding Agent做好,需要的远不止编程数据,还需要聊天、搜索、推理等综合能力。腾讯的做法会更强调体系的全面化,以及对线上回流的利用和新技术范式的探索。这需要想象力,要做好即使今天Coding Agent最重要,也要为未来做储备的准备。
12. 性价比的核心是“性能”,一次把简单任务做对,比纠结模型架构更重要
面对市场对Token成本的焦虑,姚顺雨提出了一个核心观点:性价比,性能(performance)是第一位的。他用一个反直觉的现象说明:很多人发现,用更强的模型反而更省钱,因为它能一次性把事情做对,节省了人力。尤其今年,许多简单任务的鲁棒性变得至关重要。如何用一个模型一次性、可靠地完成大量的简单任务,这可能是提升性价比更关键的部分,而不是单纯纠结于模型架构。
当然,成本也很重要。他认为中国在成本优化上是领先于世界的,腾讯也做了大量工作。他个人判断,如果能做一个相对较小的模型,同时又能比肩大模型的性能,并且在大部分任务上做到很强的鲁棒性,这比在长程任务上提升一两个百分点,可能在中国市场更有价值。
13. 不同场景的Agent需要不同的“上下文”,这正是腾讯的优势所在
汤道生指出,腾讯针对不同场景,设计了不同的Agent形态。其核心思路是“赋能”:模型能力越强,Agent需要做的工作就越少。产品要做的是为模型提供更多、更精准的工具(Skills)和记忆(Context)。比如,在Coding环境下提供代码库上下文,在办公协作场景下提供过往PPT风格和内容偏好。理解场景中什么信息是“相关的”、“重要的”,并把这些Context精准地喂给模型,这才是设计Agent的关键。
14. AI时代的产品组织要更扁平,每个工程师都是产品经理
汤道生观察到一个有趣的现象:他帮WorkBuddy看组织发文时,发现团队非常扁平,3-5人的小团队就围绕一个领域攻坚。这种组织形态支持大量试验,并允许失败。因为试验大部分拿不到正向反馈,所以必须包容试错。
此外,他预测工程师的角色将发生根本性变化。当写代码的工作被AI取代后,每个工程师都会更像一个“有想法的领导者”,驱动多个Coding Agent。同时,他们也要深度参与产品设计、评测和质量保证工作,用户需求的理解能力变得前所未有的重要。
15. 回应“腾讯AI慢了”:下半场才刚刚开始,AI会是长期且多元的游戏
对于外界“腾讯慢了”的声音,姚顺雨给出了两个判断。
第一,AI是一场马拉松,不是百米冲刺。他不认为ChatGPT和Claude Code会是唯一的Super App,那是一个“灰暗的世界”。他相信未来会有源源不断的新机会诞生,就像70年代的PC刚刚诞生时一样。第二,AI的未来会走得更“多元”,而不是沿着单一主线前进。Coding Agent固然重要,但多模态、具身智能等大量空间还未被填满。从这个角度看,下半场才刚刚开始。
他也坦诚,过去走过弯路很正常,重要的是能否诚实地面对反馈并做出改变,以及能否保持耐心。汤道生也补充说,在一个复杂的组织里,有快有慢很正常。但就像姚顺雨说的,这是一个长期游戏,腾讯丰富的场景、海量的产品和积累的“上下文”,都是未来长跑中最大的底气。
