在入职即将满半年的节点上,腾讯AI首席科学家姚顺雨又一次走到了台前。
6月5日,在2026腾讯云AI产业应用大会上,姚顺雨与腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生进行了一场同台对话,共同解读AI下半场腾讯的最新布局与思考。这也是他首次公开回应腾讯大模型与产品研发深度融合的Co-Design思路。
从OpenAI挖来的这位技术大牛,如今身兼大语言模型部和AI Infra(基础设施)部负责人,被业内视为腾讯大模型研发的“技术灵魂”。而汤道生,自2005年加入腾讯,先后执掌QQ、广点通、腾讯云等业务,在AI时代又接管了腾讯元宝、QQ浏览器等C端应用,是沉稳的业务操盘手。
两人的对话,某种程度上,恰好是在回答两个核心问题:“AI怎么造”和“AI怎么用”。
智能体正在成为重塑生产力的重要引擎。姚顺雨认为,AI的下半场已经不再单纯是寻找方法的问题,而是转向了“寻找问题”。核心在于Foundation(基础模型)、Product(产品)、Frontier(前沿模型)构成的均衡三角。大语言模型的本质区别在于泛化性,不同场景的数据需要相互赋能;而Agent的崛起,使得环境、评测与推理行动的协同,变得比单一模型的绝对能力更关键。
汤道生则表示,腾讯做AI,始终坚持以实用、好用、可规模化为目标,最核心的经验就是“扎根场景”。真实的场景里,既有用户的需求,也有模型迭代最需要的数据。
以下为这场对话的部分现场实录(经节选和整理):

汤道生:你认为AI下半场,最重要的到底是什么?
姚顺雨:先解释一下“下半场”这个词。最近有点被滥用了,这个概念其实是我去年在一篇博客里提出来的。什么意思呢?在去年之前,AI已经发展了几十年,但当时更核心的命题是怎么去解决问题,寻找好的方法。而到了现在,方法论已经变得非常成熟,反而是“寻找问题”这件事,变得越来越难了。
举个例子,过去我们发明了AlphaGo去下围棋,但这个方法就只适合下棋。你想做个翻译,就得专门做一个只做翻译的模型,它干不了别的。但有了预训练和后训练之后,我们发现手里有了一把“万能锤子”,它可以砸任何钉子。这是一个通用方法论,能解决各种各样的问题。这样一来,反倒更难的是:我们去解决哪颗钉子?
所以,AI下半场最重要的事,我个人认为是在中国建立一个长期的、基于AGI的组织。今天的AI主要由三部分构成:第一,是Foundation的部分,怎么把预训练和后训练这些最基础的东西做得扎实;第二,是产品,怎么让技术真正为人和社会创造价值;第三,是Frontier,怎么去探索新的研究范式、新的机会。
最重要的是,我们要构建一个非常均衡的、像三角形一样的组织。做Foundation,第一要有充足的资源,第二要有正确的做事方式,这和文化有关。做产品,需要好的产品sense和能做产品的人。而在中国,今天我们做前沿探索还不够多,所以我希望能把Frontier exploration的精神更多地注入到组织里。
汤道生:你提到模型和产品,产品其实是一个环境,要给模型提供上下文。我们开会时常提一个词叫Co-Design,你怎么看这个方式?尤其是在今天的元宝、AI搜索、智能客服、CodeBuddy、Workbuddy这些产品里,对模型的依赖都很深。
姚顺雨:有三点。首先,Co-Design的前提是模型本身要做得很solid,很多基础工作要做好。预训练是相对跟产品无关的事情,做扎实了就能提供很强的Foundation,而且它最大的特点是可泛化,进步能带给下游各种任务持续的价值提升。后训练最重要的,是设立正确的Eval。国内有个不好的倾向是大家喜欢刷榜,但更重要的是实事求是地基于产品和真实应用,构造更真实的Eval。
第二,要意识到“实用性”的价值大于刷榜的价值。我们在这方面做了大量工作,和很多产品进行了深度Co-Design。Co-Design的关键在于产生相互信任——怎么把产品数据用好,怎么把数据回流,怎么把Eval做好,这些细节很多,就不展开了。
第三,LLM时代和过去AI最大的区别就是泛化性。以前你做翻译产品,把翻译数据做好就行;做围棋程序,把围棋数据准备好就行。但现在,哪怕你只想做一个Coding Agent,你会发现需要的不仅是Coding的数据,还需要很强的聊天能力、搜索能力、指令遵循能力、推理能力,这是一个非常复合的数据体系。你得对这件事有自己的taste。
这带来的推论是:有很多产品的体系化公司,会有比较大的优势。比如我们和元宝的Co-Design,让模型有了很强的聊天和搜索能力,这种能力可以迁移到ima和Workbuddy上。这些产品能提供不同的数据,数据之间又能相互泛化,形成一个像网络一样的体系。我觉得这一点价值会越来越重要。
姚顺雨:我记得第一次和你聊,你讲了很多过去的经历,从QQ空间、QQ秀、QQ音乐,到云,再到元宝。这些产品从to C到to B,从远古时代到AI时代,跨度很大。我很好奇,你做产品的第一性原理是什么?哪些经验是不变的,哪些是变的?
汤道生:说到底,做产品还是要本着用户到底有什么需求,我怎么去解决他的痛点,怎么创造价值。在不同时代、不同行业,产品得给用户带来价值,他才会买单、会使用。从PC互联网时代的空间,到移动时代的各种产品,再到产业互联网的云,我们都要花大量时间和精力去听客户的声音,去帮他们解决问题。这个底层逻辑其实没怎么变。
但变化也确实很大。以前做产品,更多是通过功能去满足需求,产品方想清楚提供什么能力,用户通过菜单去选,有点像“预制菜”。但在AI时代,产品变成了一种开放式的服务形态,这带来了完全不一样的要求和挑战。用户可能用自然语言、语音来交互,产品方根本不知道他会问什么。所以你必须要充分利用模型能力去理解需求,让模型去调用工具、调用产品提供的各种能力,来应对这种开放式需求。这和过去做产品是完全不一样的。
包括你刚提到的Eval。以前做产品,功能描述很清晰,流程也很清晰,设计、研发、测试,瀑布式流程走下来。但做AI产品,最大的变化是整个流程都要重新设计。尤其是今年,大部分代码都由AI生成了,工程师花更多的时间去做架构设计,写代码的工作都交给AI了,然后定期去指导、修正。测试也要左移,更前置地想清楚各种案例的Eval环境、开放式答案的要求,甚至用户对齐的风格。感觉这个时代做产品,要求的能力更全面了。
姚顺雨:更难了。
汤道生:更难了。对了,大家都说混元3是你来腾讯后的首秀,能不能具体介绍一下?
姚顺雨:其实没什么秘密。今天做大模型,从某种程度上看是比较常规的事。我们应该把Infrastructure做好,把数据做好,算法反而不是最复杂的。主要就几个点:第一,我们把Infrastructure重建了,无论是预训练还是强化学习。第二,我们把数据和Eval做了很大改变,如何去定义更真实的问题,如何丰富数据的体系,如何提高数据质量,这是一个永无止境的追求。
第三,很多决策其实是关于怎么招人、怎么设立模型节奏、怎么每天做很多权衡。这没有一个清晰的公式,我觉得是非常靠taste驱动的事。我也挺好奇,刚才你说了Co-Design这个概念,具体到事情上,你觉得哪些事应该模型做,哪些事应该产品做?
汤道生:Co-Design在不同阶段是不一样的。过去这两年,它一直在变化,很大程度上是随着模型能力的升级在变化,当然市场和用户的需求也在变。最深的一个感受是“对齐”。当我们一起做产品、做对齐的时候,会有很多决策:产品要针对某个方向解决问题,模型怎么做才能满足需求?模型需要数据,数据该怎么标注、到什么颗粒度?什么是好的标注,什么是不好的?哪里要奖励,哪里要惩罚?还有Eval,如果产品认为好的体验,评测却不认可,那做出来的产品肯定是不一致的。
所以Co-Design给我的感觉,更多是项目组里不同角色都参与到产品设计里,定下产品目标方向,让多个角色对一些开放式问题有比较好的对齐。如果没有这个对齐,你会发现产品的行为是不可预测的,甚至有随机性,因为模型训练的过程也可能被混淆了。这是这两年我比较深的感受,你觉得呢?
姚顺雨:没错,最难的一点就是要建立信任。同理心很重要。说到底,做模型的目标和做产品的目标有很多对齐的部分,也有很多不对齐的部分。做模型的人希望模型能力越强越好,做产品的人希望用户需求越满足越好,天然就有很多不协调的地方。所以换位思考的能力非常关键。
举个和我们元宝Co-Design的细节例子。当时我们派了后训练最强的骨干力量,去帮元宝把后训练做好。那时我们自己的预训练还没准备好,但大家都知道,维护元宝这样的产品、维护它的DAU,对我们接下来做模型非常重要,对创新的合作也非常重要。当时很多算法同学不理解,我要花很大精力去解释。但现在看来,这些努力和权衡是值得的。这个动作让产品团队感受到,模型团队是真的在为产品着想。这对于后来的合作,包括混元3在元宝上成功上线,起到了非常重要的作用。技术部分可以有很多探讨,但最难的反而是怎么建立信任,怎么换位思考。
汤道生:技术的发展往往超乎预期。现在大家都在说智能体要消耗很多Token,这对混元做下一代模型研发来说,你觉得重点是什么,哪些地方比较重要?
姚顺雨:毫无疑问,今天Agent或者Coding Agent,有点像预训练一样,是不得不做的事,是最基础的能力。Coding Agent之所以重要,有一个核心原因:它有点像图灵完备的事情。当你有能力控制自己的文件系统,当你有一个容器的时候,你就是一个完整的系统。今天Agent毫无疑问是每一家模型厂商发力的重点。我觉得我们的方法会有几个不同:
第一,即使今天Coding已经是最重要的事,我们还是会强调体系的全面化。我始终认为,要把Coding做好,需要远不止Coding的数据,还需要聊天、推理等各种各样的能力。大模型最重要的点就是泛化性。
第二,产品的作用越来越重要。如何利用好线上回流,是每个模型厂商都在思考的问题。这里刚刚积累的很多Co-Design经验变得非常重要。
第三,我觉得还需要更多想象力。无论是技术演进、产品演进,还是下一个范式的演进,我们需要做探索性甚至不确定性的工作。
汤道生:从产品侧看,大家都有“Token焦虑”,Token成本在爆发式增长。很多客户甚至用户身边的同事都在盯着Token消耗。怎么让模型在解决某个问题时,Token效率更高?比如模型可能先尝试一个方向,发现走不通,再试下一个,这些来回消耗的Token,有什么可以优化的地方?
姚顺雨:在中国讨论性价比,很多人首先想到模型架构,但其实它是一个很复杂的体系。最重要的是performance。很多人跟我说,他们发现用更好的模型反而比用差的模型更省钱——因为更快的把事情做对了,省下了人的精力。所以,如果performance好,性价比才最关键。尤其今年,很多简单任务的稳定性会变得更加重要,一次把相对简单的任务做对,这可能比模型架构本身更影响性价比。
第二部分是成本本身。性价比第一是性能,性能不好,性价比无从谈起。第二才是成本。中国在成本优化方面是领先于世界的,我们做了大量工作。成本方面最重要的事,可能是怎么用一个更小的模型,去把更高价值的任务做好。在这基础上做架构创新,包括长文管理,有很多事情需要做。如果我们能有一个相对较小的模型,却能比肩大模型的性能,同时在大部分任务上表现出很强的稳定性,那它在很多长程任务上哪怕只有一两个点的提升,也会非常有价值。
我也很好奇,对于Agent这件事,你是什么时候意识到它是一个新的产品机会的?现在你认知里,第一个好用的Agent,它的瓶颈在哪里?
汤道生:我们做的Agent,针对不同场景有不同的产品形态。在Agent设计上,很大程度上是发挥好模型能力。模型在不断迭代,能力越强,Agent需要做的工作就越少。我们好几个产品在模型能力加强后,都可以把产品本身做得更简化,更多地给模型提供工具、创造更多的技能,让模型能更高效地完成任务。
比如给模型提供更多“记忆”,用户过去的使用习惯、能提取出来的偏好信息,都作为上下文。在Coding环境里有相关的上下文,在Workbuddy里做PPT,大家关注的内容和应该给到模型的上下文又不一样。所以做不同Agent,重要的是了解场景里什么信息是重要的、是相关的,能跟模型配合好,让模型有它需要的信息,同时发挥它的能力。
我也想问一个很多人讨论的问题。很多人都说腾讯慢,在AI上我们好像没有及时抓住一些机会。你觉得我们真的慢了吗?下半场到底是什么,能再多说一点吗?
姚顺雨:首先,AI现在有两个重要判断。第一个,AI是一个短期游戏还是长期游戏?硅谷很多人说,几年后所有人都要失业,AI要取代所有工作,要赶快赚两年钱退休。但我们的判断很清楚:AI是一个长期游戏。其实AI刚刚开始,下半场也才刚刚开始。我不认为ChatGPT和Claude Code会是唯一的超级应用,那将是一个非常灰暗的世界。我相信肯定会有源源不断的新机会诞生。现在可能就像70年代PC刚刚出现的时候,还有太多事情需要做。
第二个判断,它会是一个更线性还是更多元的游戏?过去几年,大家看到Pre-training、Post training,然后Agent、Coding Agent,似乎有一条非常清晰的主线,所有人都在做一样的事,都在复制。这也是非常灰暗的。但未来是变得更单一还是更多元?我个人认为会变得更多元。毫无疑问,Coding Agent的生产力会越来越重要,但它也只是刚刚开始。这个世界还有很多空间没有被填满,多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生。所以从这个角度看,下半场是刚刚开始,而不是已经结束。
过去模型和产品做了很多探索,也走了很多弯路,这是正常的。你第一次做一件事,肯定会经历曲折。但更重要的,是能不能诚实地面对自己,能不能Be Real,能不能看到反馈后去改变,能不能保持耐心。这件事,才是下半场最重要的。
