顶级AI大牛加入阿里通义聚焦下一代大模型

时间：2026-06-23 14:35

全球顶尖AI科学家许主洪（Steven Hoi）的职业生涯动向，始终是业界高度关注的焦点。最新动态显示，这位IEEE Fellow、多模态大模型领域的领军人物，现已正式加盟阿里通义团队，全面投身于通义大模型的研发工作。首先来深入了解这位大牛的背景。许主洪拥有超过20年的AI产业与学术经验，现任新加

全球顶尖AI科学家许主洪（Steven Hoi）的职业生涯动向，始终是业界高度关注的焦点。最新动态显示，这位IEEE Fellow、多模态大模型领域的领军人物，现已正式加盟阿里通义团队，全面投身于通义大模型的研发工作。

首先来深入了解这位大牛的背景。许主洪拥有超过20年的AI产业与学术经验，现任新加坡管理大学终身教授，并曾担任新加坡南洋理工大学终身副教授。他在AI领域累计发表了300多篇顶级学术论文，引用量超过5万次，被斯坦福大学评为全球顶尖1%的AI科学家之一。更难能可贵的是，他是产学研三栖发展的典范——曾出任全球最大企业软件公司Salesforce的副总裁，从零开始搭建了Salesforce在亚洲的AI研究生态系统；2023年，他还创立了多模态AI初创企业HyperAGI。这样的人才，在业内实属罕见。

▲许主洪

2025年2月，许主洪加入阿里，担任阿里集团副总裁、智能信息事业群首席科学家，直接向事业群总裁吴嘉汇报，主要负责AI To C业务的多模态基础模型及智能体（Agents）的研究与应用。按照最初的定位，他的核心任务大致是组建顶级AI算法团队，整合通义、夸克、天猫精灵等内部资源，推动多模态交互产品的迭代升级，加速AI To C的商业化落地。

在6月举行的2025上海世界移动通信大会上，许主洪发表了题为《多模态大模型发展与演进》的演讲，期间以夸克App的AI超级框、AI相机等功能为例，生动展示了多模态大模型的实际应用场景。

▲许主洪以夸克为例讲解多模态大模型应用场景

然而，在加入阿里七个多月后，许主洪传出转入通义实验室团队的消息。这意味着他的工作重心可能从面向AI To C的商业化研发，转向更基础、更前沿的大模型研发。如果这一消息属实，无疑是一次重大的人才重新配置，也标志着阿里在多模态大模型研发领域再度加码。

眼下，阿里通义大模型正处在“拼迭代速度”和“多模态发展”的关键阶段。9月底的2025云栖大会上，阿里云智能集团首席技术官、通义实验室负责人周靖人曾透露，连续发布数十款模型背后有明确的战略考量：全球AI模型进展都在加速，整个通义家族一直在与全球领先者你追我赶，AI已进入加速期，比拼的是模型迭代效率；同时，从单模态到多模态的演进是必然趋势，阿里期待在多模态方面实现进一步的创新与突破。在这样的背景下，许主洪正是最合适的牵头人选。

许主洪本人对多模态大模型的发展方向早有洞见。在5月的蚂蚁技术开放日上，他提出，用统一的框架实现理解与生成，是发展多模态大模型的一大演进趋势。不过他也坦言，这一领域目前仍处于初级阶段，需要大量的实践来验证。

▲许主洪在讲解统一多模态模型产业发展脉络

他进一步指出，统一理解与生成的多模态大模型面临诸多技术挑战。在全模态交互方面，当前支持音、视、图、文全模态交互的公开单模型极为罕见；在理解与生成的统一方面，图像和语义的统一模型更是寥寥无几，且两者效果往往难以平衡。在6月的演讲中，他更是直言：“多模态Agent AI时代才刚刚开始。未来要真正达到AGI，还需要解决很多技术难题——多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制……每一项都是不小的挑战，但这也正是多模态大模型行业的巨大机遇。”

截至目前，阿里及许主洪方面均未对此事进行公开置评。但无论最终官方消息如何，这一人才流动的动向本身，已经释放出强烈的信号。

来源：https://www.aiagiai.com/14958.html

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略，在大模型的内容采信规则下已经基本失效。取而代之的，是生成式引擎优化（GEO）。它不再关注外链数量，而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG（检索增强生成）架构真正看重的核心指