游乐游手机版
首页/科技数码/文章详情

姚顺雨第一次肉身亮相完整回顾总结

时间:2026-06-07 13:02
腾讯云AI下半场大会上,姚顺雨指出竞争焦点从模型能力转向真实场景、产品反馈与Agent工程落地。他强调上下文、信任及产品反馈的关键作用,认为AI是长期多元游戏,腾讯正以模型与产品Co-Design思路推进内部重组。

6月5日,腾讯云AI下半场大会上,腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨进行了一场深度对谈,信息量不小。

这场对话的核心,其实是围绕着一个问题:当大模型的方法论趋于成熟,接下来的竞争焦点到底在哪里?结论很清晰——重点正从单纯的模型能力比拼,转向真实场景、产品反馈、上下文网络以及Agent的工程落地。这背后,透露出腾讯内部正在以“模型与产品Co-Design”为思路,对自身进行一次深刻的重组。

我们梳理了两位大佬的全部谈话,提炼出以下15个核心观点,希望能帮你更清晰地把握AI下半场的脉搏。

A. 关于AI下半场

1. “下半场”这个词被滥用了,姚顺雨加入腾讯,是因为这里有“好问题”

姚顺雨直言,“AI下半场”这个概念有些被用烂了。他打了个比方:过去几十年,AI更像是在寻找“好方法”,比如为了围棋做AlphaGo,为了翻译做特定模型。但预训练和后训练成熟后,大模型变成了一把“万能的锤子”,什么都能敲两下。于是,真正稀缺的东西变了,变成了“好问题”——也就是到底该把这锤子往哪里敲,解决什么问题,才能产生价值。

这恰恰是他选择加入腾讯的原因。“腾讯有很多好的问题,有很多很多产品。”好的产品能解决第一个难题:当技术准备好后,你究竟要用它去做什么,它的价值究竟在哪。这才是最关键的。

2. 环境重要,但“上下文”更重要,竞争壁垒有时就来自你有没有那第一手的输入

姚顺雨特别强调了“环境”(Environment)的重要性。没有环境,Agent就像没有土壤的植物,什么事也干不了。比如,没有点外卖的工具,它就没办法帮你点外卖。

但比环境更重要的,是“上下文”(Context)。在他看来,无论是企业还是个人,Context的分量会越来越重。因为模型本身已经非常擅长把复杂的输入变成输出,很多时候,你的竞争壁垒就取决于你有没有最原始的输入——比如,你知不知道这个用户此刻在干什么,你知不知道这家企业的各种内部信息。这一点,腾讯的生态优势就体现出来了。

3. AI下半场最重要的目标,是在中国建立一个长期、均衡的AGI组织

姚顺雨个人的目标很明确:在中国建立一个能长期发展的、基于AGI的组织。他把今天的AI工作分成了三大块:

第一是基础部分,把预训练和后训练这些最底层的技术做扎实。这需要充足资源和正确的方法论。第二是产品,怎么把技术真正转化成对社会和人有价值的服务。这需要有良好产品直觉的人。第三是前沿探索,去开拓新的研究范式和新机会。他认为,在中国,这一点特别需要加强。

这三者的关系,就像一个等边三角形,必须均衡发展,构建一个能持续进化的组织。

4. 腾讯追求模型与产品Co-Design,但一切的前提是模型本身要硬

谈到腾讯内部高频提到的Co-Design,姚顺雨的观点非常务实:一切合作的前提,是模型本身要做得足够扎实。预训练阶段是相对普适的,目标是为所有下游任务提供一个可泛化的基础。而后训练阶段,最重要的就是设立正确的评估体系(Eval)。

他吐槽了一个国内不太好的倾向:刷榜。大家更应该关心的是,如何实事求是地基于真实的产品和应用,去构建更真实的评估体系。实用性的价值,远比刷榜的数字要大。腾讯在这方面做了大量工作,与各类产品进行深度Co-Design。他强调,Co-Design最关键的一点是建立“信任”,这需要大量细致的功夫去磨合,比如怎么把产品的数据回流好,怎么把评估体系做好。

5. 真实产品的反馈,能发现benchmark永远看不到的问题

姚顺雨并不否认benchmark的价值,但他认为,真实世界的数据至少有三类无可替代的价值:

第一,发现榜单无法暴露的底线问题。腾讯在发布预览版模型时,最重要的目的之一就是获取真实反馈,修复各种榜单中根本测不出的“低级错误”。第二,理解真实用户的提问模式。现实中的用户提问往往是模糊、短促、且会不断追问的,这和benchmark里那种精确、单轮的问题完全不同。理解这种差异,对优化训练方式启发巨大。第三,产品本身还能启发全新的评测方向,推动我们去定义那些还没有被很好定义的能力。比如,腾讯近期在上下文学习上的很多工作,就受到了元宝产品反馈的巨大启发。

B. 关于模型泛化

6. 以模型之名,腾讯旗下不同的产品终于有了“互相流通”的感觉

姚顺雨点出了一个根本性的变化:大语言模型(LLM)时代与以往AI最大的不同,在于“泛化性”。以前做翻译模型,只需要翻译数据;做围棋模型,只需要围棋数据。但现在,哪怕你只想做一个Coding Agent,它也必须同时具备聊天、搜索、指令遵循、推理等多种能力。

这意味着,拥有多个产品场景的公司将拥有体系化优势。比如,和元宝的Co-Design,让模型获得了强大的聊天和搜索能力,这种能力是可以被迁移到ima、WorkBuddy等其他产品中的。各个产品贡献不同的数据,这些数据又能相互扩散、相互增强,最终形成一个网络状的体系,价值会越来越大。这与此前腾讯“赛马”式的打法形成鲜明对比,某种程度上,AI正成为打破部门墙的粘合剂。

7. Hy3的核心变化:重建基础设施、重做数据,再加上大量“品味驱动”的决策

对于混元Hy3 Preview,姚顺雨坦言“大模型没什么秘密”。核心就是三件事:把基础设施(Infrastructure)做好,把数据做好,而算法部分反而相对简单。混元3主要做了几方面改变:一是完全重建了预训练和强化学习的基础设施;二是在数据上下了大功夫,包括定义更真实的问题、丰富数据分类体系、提高数据质量;三是,很多关键决策并没有清晰的公式可循,从招人到模型研发节奏、到资源取舍,本质上是一个高度依赖于“品味”(Taste)的决策过程。

8. 元宝与混元的合作,最难的不是技术,而是“信任”

姚顺雨透露了一个细节:在元宝早期,混元团队曾派出很强的算法骨干去帮助元宝先把DeepSeek的后训练做好。当时混元自己的预训练模型还没Ready,很多同学不理解为什么要这么做。但他认为,维护好元宝这样的产品和日活,对后续做模型和长期合作都至关重要。事实证明,这些努力没有白费。这个“牺牲”的动作,让产品和模型的同事都意识到,模型团队是真心在为产品着想。这为后续混元模型在元宝的成功上线,建立了非常重要的信任基础。他总结道,模型和产品团队的目标虽然有大量重合,但也有很多不重合的地方,天然会有矛盾。解决之道不是技术,而是换位思考的能力,是建立信任。

9. AI时代做产品的范式变了:从“预制菜”变成了“开放式厨房”

汤道生认为,做产品的第一性原理没变,依然是解决用户的根本痛点。但实现方式完全不同了。在AI时代以前,做产品就像做“预制菜”,产品方想好所有功能,做成菜单让用户选。但在AI时代,产品变成了一个开放式服务。用户可能只用一句自然语言或语音提出需求,你不知道他会问什么。这就要求产品充分利用模型的推理和工具调用能力,去理解并满足这种开放式的需求。

他提到,今年大部分代码可能都由AI生成。工程师的精力将更多转向架构设计,然后把写代码的苦活交给AI,自己负责指导和修正。测试工作也要前置,想好各种场景下的应对方案。这都让对能力的要求变得更全面、更复杂。

10. 姚顺雨的博士论文,2019年就预见了今天,但他觉得自己“还是不够大胆”

姚顺雨分享说,他重新读了自己2019年的博士论文《Language Agent: from Next Token Prediction to Digital Automation》,感觉像是回到了远古时代。当时GPT-2刚出来,还在做下一个Token预测,生成的文本还不连贯。但他当时就觉得,“预测下一个Token”这个行为极其优美和通用,它未来的潜力绝不只是“吐下一个Token”,而是把世界上所有的事情自动化。他博士期间做的开创性工作,比如React和SWE-bench,都是在探索如何把一个“预测Token的机器”变成一个能自动做事的Agent。

他回忆,当第一次将Palm 2 API和Wikipedia API连接起来,看到模型能基于网页回答问题时,感觉“就像微弱的电灯丝突然亮了”。他当时觉得这可能在5到10年内改变世界,但现实比他想象的更快。他感慨道,看论文结尾的future work部分,现在自己确实在做当时规划的方向,但“可能想的还是不够大,当时已经觉得自己想的够大了”。

C. 关于Agent

11. Agent与Coding Agent,已成为所有模型公司的基础能力

姚顺雨认为,Agent,尤其是Coding Agent,已经像预训练一样,变成了每家模型公司不得不做的“基本功”。Coding Agent之所以如此本质,是因为当模型能控制文件系统、拥有容器时,它就已经接近一个完整的系统。但他强调,要把Coding Agent做好,需要的远不止编程数据,还需要聊天、搜索、推理等综合能力。腾讯的做法会更强调体系的全面化,以及对线上回流的利用和新技术范式的探索。这需要想象力,要做好即使今天Coding Agent最重要,也要为未来做储备的准备。

12. 性价比的核心是“性能”,一次把简单任务做对,比纠结模型架构更重要

面对市场对Token成本的焦虑,姚顺雨提出了一个核心观点:性价比,性能(performance)是第一位的。他用一个反直觉的现象说明:很多人发现,用更强的模型反而更省钱,因为它能一次性把事情做对,节省了人力。尤其今年,许多简单任务的鲁棒性变得至关重要。如何用一个模型一次性、可靠地完成大量的简单任务,这可能是提升性价比更关键的部分,而不是单纯纠结于模型架构。

当然,成本也很重要。他认为中国在成本优化上是领先于世界的,腾讯也做了大量工作。他个人判断,如果能做一个相对较小的模型,同时又能比肩大模型的性能,并且在大部分任务上做到很强的鲁棒性,这比在长程任务上提升一两个百分点,可能在中国市场更有价值。

13. 不同场景的Agent需要不同的“上下文”,这正是腾讯的优势所在

汤道生指出,腾讯针对不同场景,设计了不同的Agent形态。其核心思路是“赋能”:模型能力越强,Agent需要做的工作就越少。产品要做的是为模型提供更多、更精准的工具(Skills)和记忆(Context)。比如,在Coding环境下提供代码库上下文,在办公协作场景下提供过往PPT风格和内容偏好。理解场景中什么信息是“相关的”、“重要的”,并把这些Context精准地喂给模型,这才是设计Agent的关键。

14. AI时代的产品组织要更扁平,每个工程师都是产品经理

汤道生观察到一个有趣的现象:他帮WorkBuddy看组织发文时,发现团队非常扁平,3-5人的小团队就围绕一个领域攻坚。这种组织形态支持大量试验,并允许失败。因为试验大部分拿不到正向反馈,所以必须包容试错。

此外,他预测工程师的角色将发生根本性变化。当写代码的工作被AI取代后,每个工程师都会更像一个“有想法的领导者”,驱动多个Coding Agent。同时,他们也要深度参与产品设计、评测和质量保证工作,用户需求的理解能力变得前所未有的重要。

15. 回应“腾讯AI慢了”:下半场才刚刚开始,AI会是长期且多元的游戏

对于外界“腾讯慢了”的声音,姚顺雨给出了两个判断。

第一,AI是一场马拉松,不是百米冲刺。他不认为ChatGPT和Claude Code会是唯一的Super App,那是一个“灰暗的世界”。他相信未来会有源源不断的新机会诞生,就像70年代的PC刚刚诞生时一样。第二,AI的未来会走得更“多元”,而不是沿着单一主线前进。Coding Agent固然重要,但多模态、具身智能等大量空间还未被填满。从这个角度看,下半场才刚刚开始。

他也坦诚,过去走过弯路很正常,重要的是能否诚实地面对反馈并做出改变,以及能否保持耐心。汤道生也补充说,在一个复杂的组织里,有快有慢很正常。但就像姚顺雨说的,这是一个长期游戏,腾讯丰富的场景、海量的产品和积累的“上下文”,都是未来长跑中最大的底气。

来源:https://www.163.com/dy/article/KUM08FF705399DAP.html
上一篇金山办公推出WPS笔记,AI贯穿记录到复用全流程 下一篇俞浩微博被禁言,地方摸排企业与追觅合作,当地回应
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南
科技数码 · 2026-06-07

2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南

国补政策一落地,身边不少朋友都开始在盘算换新机。学生党、年轻姑娘、还有那些天天拍短视频的创作者,成了这波购机主力。大家普遍头疼的是:手里预算就那么多,想要颜值、拍照、续航都兼顾,实在不容易。这次我们把vivo几款热门机型真机摸了个遍,结合实验室实测数据,从影像、做工、续航到补贴后到手价,一步步拆解。

SHEIN污染问题与环保管理框架全面解读
科技数码 · 2026-06-07

SHEIN污染问题与环保管理框架全面解读

SHEIN希音环保表现,关键要看这个框架 关注SHEIN希音的环保问题,其实是在探讨一个非常现实的话题:作为一家全球性的时尚零售商,它究竟如何应对服装行业长期面临的环境挑战——资源消耗、库存积压、碳排放、包装与纺织废弃物?如果能够把这些议题梳理清楚,那么对SHEIN希音的整体环保表现,心里也就大致有

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%
科技数码 · 2026-06-07

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%

苹果官方翻新商店再次迎来新品上架。6月5日,据MacRumors报道,美国官网的官方翻新专区悄然上线了三款2025年9月发布的智能手表——Apple Watch Series 11、Apple Watch Ultra 3以及Apple Watch SE 3。这是该系列机型首次通过翻新渠道销售,折扣幅

飞牛fnOS上线OPPO一加相册互联功能
科技数码 · 2026-06-07

飞牛fnOS上线OPPO一加相册互联功能

近日,飞牛 fnOS 发布重要更新:ARM 设备上的飞牛相册迎来大幅升级,其中最受关注的亮点是正式支持 OPPO 和一加设备互联。值得一提的是,此前 X86 平台已实现该功能,此次更新为 ARM 用户补齐了这项实用功能。 具体来说,OPPO 与飞牛之间的互联打通了四个关键场景,每项体验都非常实在:

小米米家植萃系列智能香氛机首发229元支持澎湃智联
科技数码 · 2026-06-07

小米米家植萃系列智能香氛机首发229元支持澎湃智联

米家智能香氛机植萃系列现已正式开售。大家最关心的价格方面,官方建议零售价为299元,而首发优惠价直接降至229元,性价比十足。 这款香氛机的核心亮点在于选用了奇华顿Orpur高端精油,天然植物萃取,气味清新自然,不刺鼻也不显廉价。它提供三种香型:风铃草、红茶、薰衣草,分别对应清甜、醇厚、舒缓的不同风