这几天,行业内都在讨论一场对话——腾讯云AI产业应用大会上,汤道生和姚顺雨坐在一起,聊了聊AI下半场到底意味着什么。这也是姚顺雨加入腾讯后,第一次和汤道生公开对谈。

有意思的是,两人一上来就点出了一个关键判断:AI下半场,最难的已经不是“怎么解决问题”,而是“到底该解决什么问题”。姚顺雨的原话说得很直白:“过去我们发明AlphaGo下围棋,发明翻译模型做翻译,每个方法只解决一个特定问题。但现在有了预训练和后训练,等于手里有了一个万能锤子,什么钉子都能砸。困难的反而是,到底哪些问题值得砸。”在他看来,腾讯吸引他的核心,正在于“有大量好问题、好产品”——社交、办公、内容这些场景里,藏着AI最稀缺的高质量上下文。
这个观点,汤道生从产品侧给了呼应。他特别强调了一个词:扎根场景。真实场景里既有用户需求,也有模型迭代需要的数据。腾讯的产品体系、用户交互和生态连接,恰好能为模型提供这些——不只是数据,还有调用工具、连接系统、完成任务闭环的能力。
Co-Design:模型和产品不是前后端
对话中反复出现的一个词是Co-Design。这听起来可能有点抽象,但说白了,不是模型给产品抛个API就完事了,而是一种深度协作。姚顺雨透露了一个细节:混元模型还没完全准备好的时候,团队就把后训练最强的骨干派去支持元宝产品。很多算法同学不理解,他花了不少精力去解释。但正是这个动作,让产品团队意识到模型团队是真的在替产品着想——这种信任建立起来之后,Hy3 Preview在元宝上的成功上线才有了基础。
汤道生则点出了Co-Design最难的地方:对齐。产品想解决某个方向的问题,模型需要数据,数据怎么标?什么是好的标注?评测标准怎么定?如果产品认为好的体验,评测却不认,那最终行为就会变得不可预测。他坦言,现在的AI产品开发流程和传统软件已经截然不同——今年大部分代码是AI生成的,工程师更多时间花在架构设计和评测作业上。
Agent不是万能钥匙,但Coding Agent很关键
作为ReAct架构的提出者,姚顺雨回顾了自己2019年的博士论文——当时就已经在构想语言智能体从token到数字自动化的过程。他甚至提到了一个具体的时刻:2024年7月的一个晚上,第一次把PaLM 2和Wikipedia API连在一起,让它基于网页多轮交互回答问题。用他的话说,“就像微弱电灯丝突然亮了。”
他判断Coding Agent是当下最本质的方向之一。为什么?因为它有点像图灵完备——当你能控制自己的文件系统、拥有一个容器时,你就是一个完整的系统。但他也强调,不能只做Coding。大模型最核心的特点是泛化性,要把Coding做好,需要聊天、推理、搜索等各种数据相互赋能。
汤道生从产品形态上补充了一点:随着模型能力增强,产品要做的工作反而更少了——更多是给模型提供工具、记忆和上下文。他举了WorkBuddy的例子,团队只有三五个人,扁平化组织,通过大量试验快速迭代。
腾讯慢不慢?两人都认为是长跑
外界一直有声音说腾讯在AI上动作偏慢。对此,两人都给出了直接回应。姚顺雨反问:AI是短期游戏还是长期游戏?在硅谷,很多人觉得两年后所有人都要失业,要赶快赚两年钱退休。但他们的判断是,AI刚刚开始,下半场才刚刚开始。他打了个比方:如果把ChatGPT和Claude Code当成唯一的Super App,那世界就太灰暗了。
汤道生的回应更坦诚一些:腾讯是多业态公司,有些地方做得快,有些地方慢,有些探索会失败。这些提醒都是好的。但这是马拉松,腾讯有丰富的场景和积累。“请大家多给我们反馈,多用我们的产品。”
对话最后,汤道生宣布了腾讯云“效率智能体工具集”的发布,涵盖从个人到企业、从开箱即用到深度定制的多层次产品体系。他总结说,腾讯的三个核心能力——场景联接、工程驾驭、模型驱动力——能帮助企业更安全、高效地部署智能体。姚顺雨则用一句话总结了他对腾讯AI未来的信心:今天要做的,是在中国建立一个长期的、基于AGI的组织,让foundation、product、frontier构成一个均衡的三角形。
