阿里巴巴在大模型领域迎来重要突破——集团旗下通义千问团队近日悄然组建"机器人与具身智能小组",致力于将人工智能从单纯的对话交互升级为物理世界操作能力。这一战略动向并未通过正式公告发布,而是通义千问技术负责人林俊旸在社交平台X上的发言意外曝光:"多模态模型正逐渐进化为能应对复杂时序任务的智能体,它们的终极使命是打通数字与物理世界的边界。"
年仅32岁的林俊旸已成为阿里具身智能研究的灵魂人物。这位北京大学培养的技术专家,曾成功主导M6和OFA等多个跨模态预训练项目,并带领团队打造出Qwen3-Max与QwQ-32B等核心模型产品。新组建的团队并不聚焦实体机器人制造,而是致力于为通义千问注入"行动基因"——赋予模型视觉感知、空间推理和动作规划能力,使其能够精确操控物理设备。这一战略调整展现了阿里从"语言理解"到"环境交互"的技术升级路径。
在全球科技竞赛中,具身智能已成必争之地。软银近期豪掷54亿美元收购ABB工业机器人部门,英伟达CEO黄仁勋更是直言"AI+机器人"将开创数万亿美元市场。有别于传统机器人研发模式,阿里创新性地将具身智能深度整合进Qwen大模型架构,在一个统一的智能平台上实现语言理解与动作执行的协同进化。这种"软件驱动硬件"的创新范式已经在物流自动化领域初见成效——上月阿里领投的自变量机器人完成1亿美元融资,这家专注工业应用的创新企业正在为阿里提供真实的场景验证。
阿里CEO吴泳铭近期预测,全球AI投资规模未来五年将突破4万亿美元大关。对此,阿里云已宣布投入3800亿元构建AI基础设施体系,而具身智能团队的成立正是其将云端智能延伸至终端设备的重要落子。从智能家居到智能制造,阿里正依托其在云计算、智能物流、物联网等领域的场景优势,打造从环境感知到决策执行的完整智能闭环。
这场技术变革背后,折射出阿里对人工智能本质的深层思考。当业界仍在模型参数规模上激烈竞争时,阿里已将目光投向AI改变现实世界的能力——让智能系统不仅能与人交流,更能操控设备、优化流程、创造价值。在自动化仓库的分拣流水线上,在精密制造的装配车间里,通义千问正在完成从"对话伙伴"到"智能执行者"的蜕变。这一转型不仅意味着技术突破,更可能重构未来十年人工智能产业的发展格局。
