在互联网巨头的AI竞赛中,腾讯给人的印象总是步伐相对稳健。但如果你审视它近期的举措——春节前对元宝应用的大规模资源投入,再到迅速跟进“数字分身”热潮——会发现这家公司在具体场景落地阶段变得异常果断。
打造产品,一直是腾讯最擅长的事情。在这轮人工智能浪潮中,从CodeBuddy、ima到今年的WorkBuddy,各业务线的AI智能体产品接连上线,在垂直场景中生根发芽,市场反馈同样出色。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生说得直白:腾讯始终关注产品体验,满足用户需求、为用户创造价值。外界称腾讯为产品公司,这是它的基因,在AI时代也不会发生根本性转变。
而AI的下半场,恰恰是Agent(智能体)场景落地的竞争——这或许正好撞上了腾讯最熟悉的领域。6月5日的腾讯云AI产业应用大会上,腾讯不仅正面回应了AI相关的议题,还通过发布效率智能体工具集,加速争夺下半场的主导权。
Agent重塑企业效率
AI竞争的重心,正在从比拼模型、参数,转向推进场景落地。
过去一年,腾讯始终坚持要打造“好用”的AI。怎样才算好用?从场景应用倒推去优化工具,成为了腾讯AI的核心逻辑。背后的道理很简单:真实的业务场景里,既有用户需求,也蕴藏着模型迭代最需要的数据。
腾讯丰富的产品场景、交互数据和生态连接,既能为模型提供高质量的上下文信息,也能让模型调用工具、连接系统,真正完成任务闭环。这正是腾讯最好的试验田。大会当天,腾讯一口气发布了二十多款AI原生产品,从个人知识库ima到腾讯云WAND,这些产品成为腾讯AI时代产品实力的直接证明。
以腾讯会议为例。这个日常深度使用的办公场景,这次升级了AI能力。通过声链技术,解决了过去每台设备独立收音的问题——从“各自为政”变成了“协同拾音”,同一空间里的多台电脑能组成联合收音系统。智能录制功能将录制、转写、纪要、时间戳、待办事项串联在一起,完整保留了真实的沟通现场。元宝还能在会议中主动工作,持续理解内容,实时洞察会议氛围,帮助你抓取重点、查看结论、梳理待办。升级后的腾讯会议,不再是简单的线上会议工具,而是一个更加智能的办公助手。
ima则是腾讯内部做得比较成功的一款产品,从个人知识库起步,正在迈向Agent时代的知识引擎。去年3月上线知识号体系后,经过400多天的发展,ima知识号已经覆盖金融、法律、教育等20多个行业,信源累计应用次数超过1.4亿,成为Agent时代被AI消费的内容。
ima知识号支持用户创建知识号、发布订阅知识库,分享可公开的知识资产。这标志着个人知识管理从“个人与团队的知识调用”迈入了“公开发布与价值流通”的新阶段。背后的逻辑很清晰:解决问题、被AI调用、获得更多算力,是生产力的价值;而付费订阅、提供咨询、粉丝管理,则体现了服务的价值。
ima知识号下的创作者群体,包括教授、律师、医生等各行业的知识生产者。用户沉淀的每一篇知识、封装的每一个技能(Skill),都在为Agent注入可供调用的专业能力,这些会逐步成为AI的智力燃料。长期来看,ima知识号的产品全景拥有更多曝光场景,让知识号能被更多AI发现;包含更多知识形态,不仅能分享订阅知识库,也能分享Skills,让知识既能被对话调用,也能被直接调用;此外还有更多经营工具,让认真经营的人能获得长期回报。未来,ima的目标是成为Agent时代的知识引擎。
不仅是个人AI知识库,腾讯也为企业带来了AI时代的智能知识库。腾讯乐享作为企业组织级中枢,是一站式企业社区加AI知识库。它的Agent模式能拆解多任务、直接生成知识产物,并将产物再次沉淀入库。知识库不再是静态的资料仓库,而是一座可持续运转的工作台——配合自动化任务与技能体系,同时提升知识“消费”与“生产”的效率。

为了让知识库更可信,乐享从知识入库环节就开始治理:自动检测敏感词、识别重复文档并建议归档下架,再借助知识图谱发现文档间的冲突。AI评审会把用户的知识标准嵌入生产流程,指出问题并给出修改建议。大会上,腾讯乐享发布了与WorkBuddy的联合版本:用户在WorkBuddy资料库中即可一键进入乐享知识库,团队的知识沉淀无需切换系统就能直接调用。WorkBuddy执行任务时能获取完整的企业上下文,执行生成的产物又能直接存档入库——真正打通了“知识沉淀→任务执行→产物入库”的完整闭环。
显而易见,腾讯发布的Agent,正在成为办公提效场景中最得力的智能助手。
Agent加速影视工业化升级
智能体不仅深度应用于办公提效,在影视内容的制作生产环节,也注入了全新动力。
大会上,腾讯云正式发布了音视频AI品牌WAND。WAND从底层模型、媒体AI能力到接入方式全面升级,以Agent-Native模式向行业开放。进入Agent时代,音视频不仅要“传得快、播得清”,还得承担起Agent的“眼、耳、口”——既要读懂画面与声音,也要生成可看可听的内容,帮助Agent实现更智能的视听体验。要让Agent流畅调用这些能力,生产必须端到端自动跑通,传统割裂的工具链已经难以胜任。腾讯云音视频在编解码、传输、增强等长期积累的原子能力之上,引入了六大自研媒体专用模型,以Agent-Native方式开放,构成了WAND——从生成到交付一站式完成。

WAND的媒体专用模型更贴合业务实际需求。六大模型基于腾讯云音视频业务沉淀的垂直领域生产数据训练,针对不同行业、不同场景分别做了专项调优,因此在真实业务中能保持稳定产出、多场景适配。以AIGC内容处理为例,在AI换装、商品套图等电商应用中,WAND生成模型针对不同品类、不同业务需求分别训练了处理策略:换装能区分毛衣、西装的版型与材质差异,套图贴合电商运营实际的构图与风格,报错率更低、图片可用率更高。
WAND还解决了生产效率问题。它把生成、理解、处理、编码的能力纳入同一套体系,以Agent友好的方式开放编排接口。Agent可以从内容理解走到素材生成,再自动完成画质增强与编码适配,端到端跑通整条链路,无需切换工具。在短漫剧场景中,WAND依托生成、擦除、增强、压缩等模型能力,将剧本生成、分镜制作、角色一致性保持、智能配音、合成增强串联成一条自动链路,从生产到交付,整套素材由Agent驱动产出,目前已服务国内80%以上的头部短剧平台。
短剧市场这两年热度极高。到2027年,短剧市场规模预计将跨越1000亿,超过10.5亿的短视频用户正在以前所未有的速度消费着真人剧内容。除了WAND底层模型与视频处理能力,本次大会也正式推出了真人剧工业化AI能力底座——真人剧Agent。在腾讯看来,真人剧Agent的价值不是“生成一个视频”,而是帮助客户建立一套可复用、可集成、可规模化的真人剧生产能力。
腾讯推出的真人剧Agent有三个核心能力方向:面向规模化短剧生产、短剧全球化分发、短剧营销与品牌IP打造,各配备对应的模型能力,形成完整的能力矩阵,助力真人剧生产更快、分发更广、资产更稳。简单说,腾讯真人剧Agent的功能点完全对齐影视制作行业流程,覆盖剧本创作、选角定妆、场景布置、分镜脚本生成、拍摄剪辑和二创的全流程。
可以看到,腾讯正把AI如何解决问题、如何做到好用作为核心标准,通过业务场景与Agent融合,重构腾讯AI的底层逻辑。正如腾讯AI首席科学家姚顺雨在与汤道生的对话中所言:AI的下半场,核心在于寻找好的方法;而今天方法论已高度成熟,真正困难的是如何寻找好的问题去解决。预训练与后训练带来的通用能力,让大模型如同“万能锤子”,但关键竞争壁垒在于谁拥有最原始的输入——也就是Context,无论是企业信息还是个人场景数据。
在AI时代,腾讯正在摸索一条属于自己的新路径。
腾讯AI的长期主义
腾讯的AI叙事越来越清晰,它正沿着摸索出来的路线往前走——从模型驱动、工程驾驭,到场景连接,稳步前行。
姚顺雨在与汤道生的对话中强调:AI的下半场已从寻找方法转向寻找问题,核心在于Foundation(基础模型)、Product(产品)、Frontier(前沿模型)构成的均衡三角。对于基础层来说,第一重要的是拥有充足资源,第二是需要正确的做事方式。
自从姚顺雨加入腾讯以来,外界一直关注的Hy3 Preview在今年4月正式上线并开源。重新出发的混元大模型Hy3 Preview以实用性和性价比著称,发布以来连续数周登顶全球大模型API调用榜单OpenRouter周榜首位。
腾讯最不缺的是产品能力。汤道生坦言:在AI时代,运营成本、边际成本不一样,所以需要不同的商业模式来承载服务。但产品创造的价值足够大、能够量化,用户或客户还是会为它买单。在这波AI浪潮中,腾讯多个小团队做出了明星产品——WorkBuddy、CodeBuddy最初都诞生于3-5人的小团队。小规模团队效率高、相对灵活,能让项目迅速跑出来。汤道生说得很实在:“只要你有想法、有创意,你就可以跟AI协作把完整的产品打造出来。未来的团队应该会越来越小,更多三五成群的feature team去完成产品研发的工作。”
底层模型能力不断提升,产品不断优化,腾讯的AI似乎走出了一条适配自身生态的路。从一季度的财报就能看到明显提升:AI战略全面提速——模型重构带动调用量激增、Agent规模化落地并取得市场领先。ToB业务(金融科技及企业服务)实现营收599亿元,企业服务收入同比增长20%。在旺盛的AI需求带动下,腾讯云继全年规模盈利后,延续高质量增长势头,国际业务一季度收入同比增长超过40%。
从目前来看,腾讯的AI依然坚定地在自有生态中寻找更适合自己的发展道路。过去28年,腾讯的产品理念一向是:一旦判定产品具备价值,就会坚定投入、穿越周期。在AI时代,腾讯依然如此——强化场景连接,聚焦具体场景,通过AI的能力将不同场景连接起来。这恰恰是腾讯在自己生态中特别擅长的事情。
