汤道生与姚顺雨对话：腾讯AI下半场模型产品如何互相成就

时间：2026-06-06 13:22

腾讯AI进入下半场，核心在于模型与产品的深度Co-Design。姚顺雨提出基础模型、产品、前沿探索构成的均衡三角，强调泛化性与实用价值。汤道生指出扎根真实场景、以实用好用可规模化为目标，模型与产品需相互赋能。

在入职即将满半年的节点上，腾讯AI首席科学家姚顺雨又一次走到了台前。

6月5日，在2026腾讯云AI产业应用大会上，姚顺雨与腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生进行了一场同台对话，共同解读AI下半场腾讯的最新布局与思考。这也是他首次公开回应腾讯大模型与产品研发深度融合的Co-Design思路。

从OpenAI挖来的这位技术大牛，如今身兼大语言模型部和AI Infra（基础设施）部负责人，被业内视为腾讯大模型研发的“技术灵魂”。而汤道生，自2005年加入腾讯，先后执掌QQ、广点通、腾讯云等业务，在AI时代又接管了腾讯元宝、QQ浏览器等C端应用，是沉稳的业务操盘手。

两人的对话，某种程度上，恰好是在回答两个核心问题：“AI怎么造”和“AI怎么用”。

智能体正在成为重塑生产力的重要引擎。姚顺雨认为，AI的下半场已经不再单纯是寻找方法的问题，而是转向了“寻找问题”。核心在于Foundation（基础模型）、Product（产品）、Frontier（前沿模型）构成的均衡三角。大语言模型的本质区别在于泛化性，不同场景的数据需要相互赋能；而Agent的崛起，使得环境、评测与推理行动的协同，变得比单一模型的绝对能力更关键。

汤道生则表示，腾讯做AI，始终坚持以实用、好用、可规模化为目标，最核心的经验就是“扎根场景”。真实的场景里，既有用户的需求，也有模型迭代最需要的数据。

以下为这场对话的部分现场实录（经节选和整理）：

汤道生：你认为AI下半场，最重要的到底是什么？

姚顺雨：先解释一下“下半场”这个词。最近有点被滥用了，这个概念其实是我去年在一篇博客里提出来的。什么意思呢？在去年之前，AI已经发展了几十年，但当时更核心的命题是怎么去解决问题，寻找好的方法。而到了现在，方法论已经变得非常成熟，反而是“寻找问题”这件事，变得越来越难了。

举个例子，过去我们发明了AlphaGo去下围棋，但这个方法就只适合下棋。你想做个翻译，就得专门做一个只做翻译的模型，它干不了别的。但有了预训练和后训练之后，我们发现手里有了一把“万能锤子”，它可以砸任何钉子。这是一个通用方法论，能解决各种各样的问题。这样一来，反倒更难的是：我们去解决哪颗钉子？

所以，AI下半场最重要的事，我个人认为是在中国建立一个长期的、基于AGI的组织。今天的AI主要由三部分构成：第一，是Foundation的部分，怎么把预训练和后训练这些最基础的东西做得扎实；第二，是产品，怎么让技术真正为人和社会创造价值；第三，是Frontier，怎么去探索新的研究范式、新的机会。

最重要的是，我们要构建一个非常均衡的、像三角形一样的组织。做Foundation，第一要有充足的资源，第二要有正确的做事方式，这和文化有关。做产品，需要好的产品sense和能做产品的人。而在中国，今天我们做前沿探索还不够多，所以我希望能把Frontier exploration的精神更多地注入到组织里。

汤道生：你提到模型和产品，产品其实是一个环境，要给模型提供上下文。我们开会时常提一个词叫Co-Design，你怎么看这个方式？尤其是在今天的元宝、AI搜索、智能客服、CodeBuddy、Workbuddy这些产品里，对模型的依赖都很深。

姚顺雨：有三点。首先，Co-Design的前提是模型本身要做得很solid，很多基础工作要做好。预训练是相对跟产品无关的事情，做扎实了就能提供很强的Foundation，而且它最大的特点是可泛化，进步能带给下游各种任务持续的价值提升。后训练最重要的，是设立正确的Eval。国内有个不好的倾向是大家喜欢刷榜，但更重要的是实事求是地基于产品和真实应用，构造更真实的Eval。

第二，要意识到“实用性”的价值大于刷榜的价值。我们在这方面做了大量工作，和很多产品进行了深度Co-Design。Co-Design的关键在于产生相互信任——怎么把产品数据用好，怎么把数据回流，怎么把Eval做好，这些细节很多，就不展开了。

第三，LLM时代和过去AI最大的区别就是泛化性。以前你做翻译产品，把翻译数据做好就行；做围棋程序，把围棋数据准备好就行。但现在，哪怕你只想做一个Coding Agent，你会发现需要的不仅是Coding的数据，还需要很强的聊天能力、搜索能力、指令遵循能力、推理能力，这是一个非常复合的数据体系。你得对这件事有自己的taste。

这带来的推论是：有很多产品的体系化公司，会有比较大的优势。比如我们和元宝的Co-Design，让模型有了很强的聊天和搜索能力，这种能力可以迁移到ima和Workbuddy上。这些产品能提供不同的数据，数据之间又能相互泛化，形成一个像网络一样的体系。我觉得这一点价值会越来越重要。

姚顺雨：我记得第一次和你聊，你讲了很多过去的经历，从QQ空间、QQ秀、QQ音乐，到云，再到元宝。这些产品从to C到to B，从远古时代到AI时代，跨度很大。我很好奇，你做产品的第一性原理是什么？哪些经验是不变的，哪些是变的？

汤道生：说到底，做产品还是要本着用户到底有什么需求，我怎么去解决他的痛点，怎么创造价值。在不同时代、不同行业，产品得给用户带来价值，他才会买单、会使用。从PC互联网时代的空间，到移动时代的各种产品，再到产业互联网的云，我们都要花大量时间和精力去听客户的声音，去帮他们解决问题。这个底层逻辑其实没怎么变。

但变化也确实很大。以前做产品，更多是通过功能去满足需求，产品方想清楚提供什么能力，用户通过菜单去选，有点像“预制菜”。但在AI时代，产品变成了一种开放式的服务形态，这带来了完全不一样的要求和挑战。用户可能用自然语言、语音来交互，产品方根本不知道他会问什么。所以你必须要充分利用模型能力去理解需求，让模型去调用工具、调用产品提供的各种能力，来应对这种开放式需求。这和过去做产品是完全不一样的。

包括你刚提到的Eval。以前做产品，功能描述很清晰，流程也很清晰，设计、研发、测试，瀑布式流程走下来。但做AI产品，最大的变化是整个流程都要重新设计。尤其是今年，大部分代码都由AI生成了，工程师花更多的时间去做架构设计，写代码的工作都交给AI了，然后定期去指导、修正。测试也要左移，更前置地想清楚各种案例的Eval环境、开放式答案的要求，甚至用户对齐的风格。感觉这个时代做产品，要求的能力更全面了。

姚顺雨：更难了。

汤道生：更难了。对了，大家都说混元3是你来腾讯后的首秀，能不能具体介绍一下？

姚顺雨：其实没什么秘密。今天做大模型，从某种程度上看是比较常规的事。我们应该把Infrastructure做好，把数据做好，算法反而不是最复杂的。主要就几个点：第一，我们把Infrastructure重建了，无论是预训练还是强化学习。第二，我们把数据和Eval做了很大改变，如何去定义更真实的问题，如何丰富数据的体系，如何提高数据质量，这是一个永无止境的追求。

第三，很多决策其实是关于怎么招人、怎么设立模型节奏、怎么每天做很多权衡。这没有一个清晰的公式，我觉得是非常靠taste驱动的事。我也挺好奇，刚才你说了Co-Design这个概念，具体到事情上，你觉得哪些事应该模型做，哪些事应该产品做？

汤道生：Co-Design在不同阶段是不一样的。过去这两年，它一直在变化，很大程度上是随着模型能力的升级在变化，当然市场和用户的需求也在变。最深的一个感受是“对齐”。当我们一起做产品、做对齐的时候，会有很多决策：产品要针对某个方向解决问题，模型怎么做才能满足需求？模型需要数据，数据该怎么标注、到什么颗粒度？什么是好的标注，什么是不好的？哪里要奖励，哪里要惩罚？还有Eval，如果产品认为好的体验，评测却不认可，那做出来的产品肯定是不一致的。

所以Co-Design给我的感觉，更多是项目组里不同角色都参与到产品设计里，定下产品目标方向，让多个角色对一些开放式问题有比较好的对齐。如果没有这个对齐，你会发现产品的行为是不可预测的，甚至有随机性，因为模型训练的过程也可能被混淆了。这是这两年我比较深的感受，你觉得呢？

姚顺雨：没错，最难的一点就是要建立信任。同理心很重要。说到底，做模型的目标和做产品的目标有很多对齐的部分，也有很多不对齐的部分。做模型的人希望模型能力越强越好，做产品的人希望用户需求越满足越好，天然就有很多不协调的地方。所以换位思考的能力非常关键。

举个和我们元宝Co-Design的细节例子。当时我们派了后训练最强的骨干力量，去帮元宝把后训练做好。那时我们自己的预训练还没准备好，但大家都知道，维护元宝这样的产品、维护它的DAU，对我们接下来做模型非常重要，对创新的合作也非常重要。当时很多算法同学不理解，我要花很大精力去解释。但现在看来，这些努力和权衡是值得的。这个动作让产品团队感受到，模型团队是真的在为产品着想。这对于后来的合作，包括混元3在元宝上成功上线，起到了非常重要的作用。技术部分可以有很多探讨，但最难的反而是怎么建立信任，怎么换位思考。

汤道生：技术的发展往往超乎预期。现在大家都在说智能体要消耗很多Token，这对混元做下一代模型研发来说，你觉得重点是什么，哪些地方比较重要？

姚顺雨：毫无疑问，今天Agent或者Coding Agent，有点像预训练一样，是不得不做的事，是最基础的能力。Coding Agent之所以重要，有一个核心原因：它有点像图灵完备的事情。当你有能力控制自己的文件系统，当你有一个容器的时候，你就是一个完整的系统。今天Agent毫无疑问是每一家模型厂商发力的重点。我觉得我们的方法会有几个不同：

第一，即使今天Coding已经是最重要的事，我们还是会强调体系的全面化。我始终认为，要把Coding做好，需要远不止Coding的数据，还需要聊天、推理等各种各样的能力。大模型最重要的点就是泛化性。

第二，产品的作用越来越重要。如何利用好线上回流，是每个模型厂商都在思考的问题。这里刚刚积累的很多Co-Design经验变得非常重要。

第三，我觉得还需要更多想象力。无论是技术演进、产品演进，还是下一个范式的演进，我们需要做探索性甚至不确定性的工作。

汤道生：从产品侧看，大家都有“Token焦虑”，Token成本在爆发式增长。很多客户甚至用户身边的同事都在盯着Token消耗。怎么让模型在解决某个问题时，Token效率更高？比如模型可能先尝试一个方向，发现走不通，再试下一个，这些来回消耗的Token，有什么可以优化的地方？

姚顺雨：在中国讨论性价比，很多人首先想到模型架构，但其实它是一个很复杂的体系。最重要的是performance。很多人跟我说，他们发现用更好的模型反而比用差的模型更省钱——因为更快的把事情做对了，省下了人的精力。所以，如果performance好，性价比才最关键。尤其今年，很多简单任务的稳定性会变得更加重要，一次把相对简单的任务做对，这可能比模型架构本身更影响性价比。

第二部分是成本本身。性价比第一是性能，性能不好，性价比无从谈起。第二才是成本。中国在成本优化方面是领先于世界的，我们做了大量工作。成本方面最重要的事，可能是怎么用一个更小的模型，去把更高价值的任务做好。在这基础上做架构创新，包括长文管理，有很多事情需要做。如果我们能有一个相对较小的模型，却能比肩大模型的性能，同时在大部分任务上表现出很强的稳定性，那它在很多长程任务上哪怕只有一两个点的提升，也会非常有价值。

我也很好奇，对于Agent这件事，你是什么时候意识到它是一个新的产品机会的？现在你认知里，第一个好用的Agent，它的瓶颈在哪里？

汤道生：我们做的Agent，针对不同场景有不同的产品形态。在Agent设计上，很大程度上是发挥好模型能力。模型在不断迭代，能力越强，Agent需要做的工作就越少。我们好几个产品在模型能力加强后，都可以把产品本身做得更简化，更多地给模型提供工具、创造更多的技能，让模型能更高效地完成任务。

比如给模型提供更多“记忆”，用户过去的使用习惯、能提取出来的偏好信息，都作为上下文。在Coding环境里有相关的上下文，在Workbuddy里做PPT，大家关注的内容和应该给到模型的上下文又不一样。所以做不同Agent，重要的是了解场景里什么信息是重要的、是相关的，能跟模型配合好，让模型有它需要的信息，同时发挥它的能力。

我也想问一个很多人讨论的问题。很多人都说腾讯慢，在AI上我们好像没有及时抓住一些机会。你觉得我们真的慢了吗？下半场到底是什么，能再多说一点吗？

姚顺雨：首先，AI现在有两个重要判断。第一个，AI是一个短期游戏还是长期游戏？硅谷很多人说，几年后所有人都要失业，AI要取代所有工作，要赶快赚两年钱退休。但我们的判断很清楚：AI是一个长期游戏。其实AI刚刚开始，下半场也才刚刚开始。我不认为ChatGPT和Claude Code会是唯一的超级应用，那将是一个非常灰暗的世界。我相信肯定会有源源不断的新机会诞生。现在可能就像70年代PC刚刚出现的时候，还有太多事情需要做。

第二个判断，它会是一个更线性还是更多元的游戏？过去几年，大家看到Pre-training、Post training，然后Agent、Coding Agent，似乎有一条非常清晰的主线，所有人都在做一样的事，都在复制。这也是非常灰暗的。但未来是变得更单一还是更多元？我个人认为会变得更多元。毫无疑问，Coding Agent的生产力会越来越重要，但它也只是刚刚开始。这个世界还有很多空间没有被填满，多模态、具身智能，很多很多新的事情都在发生，或者刚刚发生。所以从这个角度看，下半场是刚刚开始，而不是已经结束。

过去模型和产品做了很多探索，也走了很多弯路，这是正常的。你第一次做一件事，肯定会经历曲折。但更重要的，是能不能诚实地面对自己，能不能Be Real，能不能看到反馈后去改变，能不能保持耐心。这件事，才是下半场最重要的。

来源：https://www.donews.com/news/detail/1/6584390.html

腾讯AI