全球顶尖AI科学家许主洪(Steven Hoi)的职业生涯动向,始终是业界高度关注的焦点。最新动态显示,这位IEEE Fellow、多模态大模型领域的领军人物,现已正式加盟阿里通义团队,全面投身于通义大模型的研发工作。
首先来深入了解这位大牛的背景。许主洪拥有超过20年的AI产业与学术经验,现任新加坡管理大学终身教授,并曾担任新加坡南洋理工大学终身副教授。他在AI领域累计发表了300多篇顶级学术论文,引用量超过5万次,被斯坦福大学评为全球顶尖1%的AI科学家之一。更难能可贵的是,他是产学研三栖发展的典范——曾出任全球最大企业软件公司Salesforce的副总裁,从零开始搭建了Salesforce在亚洲的AI研究生态系统;2023年,他还创立了多模态AI初创企业HyperAGI。这样的人才,在业内实属罕见。

▲许主洪
2025年2月,许主洪加入阿里,担任阿里集团副总裁、智能信息事业群首席科学家,直接向事业群总裁吴嘉汇报,主要负责AI To C业务的多模态基础模型及智能体(Agents)的研究与应用。按照最初的定位,他的核心任务大致是组建顶级AI算法团队,整合通义、夸克、天猫精灵等内部资源,推动多模态交互产品的迭代升级,加速AI To C的商业化落地。
在6月举行的2025上海世界移动通信大会上,许主洪发表了题为《多模态大模型发展与演进》的演讲,期间以夸克App的AI超级框、AI相机等功能为例,生动展示了多模态大模型的实际应用场景。

▲许主洪以夸克为例讲解多模态大模型应用场景
然而,在加入阿里七个多月后,许主洪传出转入通义实验室团队的消息。这意味着他的工作重心可能从面向AI To C的商业化研发,转向更基础、更前沿的大模型研发。如果这一消息属实,无疑是一次重大的人才重新配置,也标志着阿里在多模态大模型研发领域再度加码。
眼下,阿里通义大模型正处在“拼迭代速度”和“多模态发展”的关键阶段。9月底的2025云栖大会上,阿里云智能集团首席技术官、通义实验室负责人周靖人曾透露,连续发布数十款模型背后有明确的战略考量:全球AI模型进展都在加速,整个通义家族一直在与全球领先者你追我赶,AI已进入加速期,比拼的是模型迭代效率;同时,从单模态到多模态的演进是必然趋势,阿里期待在多模态方面实现进一步的创新与突破。在这样的背景下,许主洪正是最合适的牵头人选。
许主洪本人对多模态大模型的发展方向早有洞见。在5月的蚂蚁技术开放日上,他提出,用统一的框架实现理解与生成,是发展多模态大模型的一大演进趋势。不过他也坦言,这一领域目前仍处于初级阶段,需要大量的实践来验证。

▲许主洪在讲解统一多模态模型产业发展脉络
他进一步指出,统一理解与生成的多模态大模型面临诸多技术挑战。在全模态交互方面,当前支持音、视、图、文全模态交互的公开单模型极为罕见;在理解与生成的统一方面,图像和语义的统一模型更是寥寥无几,且两者效果往往难以平衡。在6月的演讲中,他更是直言:“多模态Agent AI时代才刚刚开始。未来要真正达到AGI,还需要解决很多技术难题——多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制……每一项都是不小的挑战,但这也正是多模态大模型行业的巨大机遇。”
截至目前,阿里及许主洪方面均未对此事进行公开置评。但无论最终官方消息如何,这一人才流动的动向本身,已经释放出强烈的信号。
