最近,在2025世界人工智能大会的腾讯论坛上,一份由腾讯研究院联合内部多个技术实验室发布的报告,引起了业内的广泛讨论。这份名为《共生伙伴:2025人工智能十大趋势》的报告,清晰地指出了一个核心转变:AI的角色,正从一个被动的“智能工具”,演变为我们工作与生活中主动的“共生伙伴”。基础模型、多模态、具身智能等技术的集体突破,正在将AI更深地编织进社会运行的肌理之中。今天,我们就来梳理一下这份报告所揭示的十大关键趋势。
序言
报告的开篇,由两位资深专家奠定了基调。
司晓在《从智能工具到共生伙伴》中提出,AI的进化轨迹已经清晰。随着强化学习、多模态融合等技术的成熟,大模型不仅拥有了推理和行动的能力,更开始具备情感化交互的雏形。这意味着,AI不再只是等待指令的机器,而是能够主动理解、甚至预判用户需求的“人生合伙人”。未来的看点在于,空间智能和具身智能将推动AI完成从数字世界到物理世界的“惊险一跃”,实现从“会聊天”到“懂世界”的本质跨越。
吴运声则在《打造更好用的AI》中强调了落地的视角。他认为,AI的未来不仅是实验室里的技术竞赛,更是产业应用的能力比拼。腾讯所聚焦的,是“离产业更近的AI”,通过模型、平台、应用三层架构的扎实布局,推动AI从“有能力”向“有用处”切实转化。下一阶段的关键,将围绕安全、可控与普惠展开,让技术真正转化为驱动企业与社会前进的价值。
趋势01 强化学习:引领大模型推理与行动能力突破
强化学习正在经历一次重要的范式转移:从早期专注于“对齐人类偏好”(RLHF),转向更注重“基于可验证结果进行优化”(RLVR)。这一转变,正推动大模型从出色的内容生成者,升级为复杂的现实问题解决者。在医疗诊断、金融策略等领域,AI通过强化学习已经能够进行自主决策,甚至探索出超越传统人类经验的新路径与新策略。
趋势02 原生多模态生成:感知与生成的统一
AI的感知能力正从过去分散的、单一模态的处理,走向跨模态的统一建模与生成。文本、图像、音频不再是割裂的信息,而是可以被同一个模型联合理解与创造的元素。像OpenAI的GPT-4o和Sora这样的模型,已经展示了这种无缝处理多模态信息的能力,这无疑将重塑影视创作、电商营销等众多行业的交互与生产体验。
趋势03 声音模型的情感智能进化
语音合成技术早已超越了机械朗读的初级阶段,正在向富有情感、节奏和个性化的表达进化。当这种能力与多模态技术结合,AI声音可以实时生成适配场景的音乐、进行富有感染力的配音,甚至驱动虚拟角色进行有温度的互动。在教育、远程医疗、娱乐等领域,它正在成为一个真正的“情感伙伴”。
趋势04 智能体双轨进化:编排类与端到端并行
当前,AI智能体(Agent)的发展呈现出两种主要路径,它们各有侧重,并行不悖:
- 编排类Agent:以AutoGPT为代表,其核心在于像一个“调度中心”,通过调用和组合各种外部工具、API来完成复杂任务。这种路径在企业级应用中备受青睐,因为它强调过程的透明性与可控性。
- 端到端Agent:以OpenAI的o3模型为例,它将推理能力与工具使用能力内化到模型内部,展现出更强的自主性与深度。在科研、复杂编程等专业领域,这类智能体正开始展现其独特价值。
趋势05 LifeOS:AI成为个性化生活操作系统
AI的角色,开始从解决单次任务的“工具”,演变为一个持续学习、长期陪伴的“数字自我”。它可以整合用户长期的记忆、行为习惯甚至情绪数据,从而主动管理日程、优化健康计划,并提供必要的情感支持。ChatGPT推出的Memory功能,正是向这个“个人生活操作系统”(LifeOS)迈出的早期一步。
趋势06 智力即服务:智能化工作流赋能产业
对企业而言,AI的价值正通过“智能体化”的工作流深入业务流程。企业的知识库不再只是静态的资产,而是被转化为一个“可调度、可推理的认知系统”。例如,微软365 Copilot利用检索增强生成(RAG)等技术,让企业知识能够被实时调用,直接辅助决策与创作,这本质上是在提供一种“智力即服务”。
趋势07 游戏智能体:虚拟世界的沉浸式进化
游戏世界一直是AI技术的绝佳试验场。如今的游戏AI,已经从遵循固定脚本的NPC,进化为拥有情感反应和社交学习能力的“数字生命”。比如在《暗区突围》这类游戏中,AI队友已经能够动态适应不同玩家的战斗风格。这种进化,正在为未来更成熟的元宇宙社交生态打下坚实的基础。
趋势08 具身智能的“GPT-2时刻”
具身智能,即让AI拥有物理身体并与之互动,正迎来其基础设施成熟的临界点。基础模型(如视觉语言动作模型VLA)、大规模数据工程以及高仿真训练平台的协同突破,正在将机器人从实验室快速推向量产应用的前夜。特斯拉的Optimus、腾讯的“小五”机器人等,已经在制造、家庭服务等场景中,展现出令人印象深刻的类人行动能力。
趋势09 空间智能:AI从词元到体素的跨越
AI的理解维度,正在从文本的“词元”(Token)扩展到三维物理空间的“体素”(Voxel)。这种对三维空间的深度理解与生成能力,是自动驾驶、混合现实(XR)等领域的核心技术。李飞飞教授领导的World Labs项目,致力于生成可交互的3D场景,这为未来的智慧城市、建筑设计与游戏开发提供了全新的工具范式。
趋势10 测试转量产:具身智能本体加速成熟
趋势的最后一环,落在承载AI的物理本体——机器人身上。随着运动控制、感知系统等核心模块的逐步标准化,人形机器人开始从测试阶段走向特定场景的量产应用。在物流、护理等需求迫切的领域,Figure 02、Agility Digit等产品已实现千台级别的量产部署。这标志着一个关键转折:AI的“数字大脑”,正在大规模地获得“物理身体”,去执行真实世界的任务。

