游乐游手机版
首页/AI教程/文章详情

顶级AI大牛加入阿里通义 聚焦下一代大模型

时间:2026-06-23 14:35
全球顶尖AI科学家许主洪(Steven Hoi)的职业生涯动向,始终是业界高度关注的焦点。最新动态显示,这位IEEE Fellow、多模态大模型领域的领军人物,现已正式加盟阿里通义团队,全面投身于通义大模型的研发工作。 首先来深入了解这位大牛的背景。许主洪拥有超过20年的AI产业与学术经验,现任新加

全球顶尖AI科学家许主洪(Steven Hoi)的职业生涯动向,始终是业界高度关注的焦点。最新动态显示,这位IEEE Fellow、多模态大模型领域的领军人物,现已正式加盟阿里通义团队,全面投身于通义大模型的研发工作。

首先来深入了解这位大牛的背景。许主洪拥有超过20年的AI产业与学术经验,现任新加坡管理大学终身教授,并曾担任新加坡南洋理工大学终身副教授。他在AI领域累计发表了300多篇顶级学术论文,引用量超过5万次,被斯坦福大学评为全球顶尖1%的AI科学家之一。更难能可贵的是,他是产学研三栖发展的典范——曾出任全球最大企业软件公司Salesforce的副总裁,从零开始搭建了Salesforce在亚洲的AI研究生态系统;2023年,他还创立了多模态AI初创企业HyperAGI。这样的人才,在业内实属罕见。

▲许主洪

2025年2月,许主洪加入阿里,担任阿里集团副总裁、智能信息事业群首席科学家,直接向事业群总裁吴嘉汇报,主要负责AI To C业务的多模态基础模型及智能体(Agents)的研究与应用。按照最初的定位,他的核心任务大致是组建顶级AI算法团队,整合通义、夸克、天猫精灵等内部资源,推动多模态交互产品的迭代升级,加速AI To C的商业化落地。

在6月举行的2025上海世界移动通信大会上,许主洪发表了题为《多模态大模型发展与演进》的演讲,期间以夸克App的AI超级框、AI相机等功能为例,生动展示了多模态大模型的实际应用场景。

▲许主洪以夸克为例讲解多模态大模型应用场景

然而,在加入阿里七个多月后,许主洪传出转入通义实验室团队的消息。这意味着他的工作重心可能从面向AI To C的商业化研发,转向更基础、更前沿的大模型研发。如果这一消息属实,无疑是一次重大的人才重新配置,也标志着阿里在多模态大模型研发领域再度加码。

眼下,阿里通义大模型正处在“拼迭代速度”和“多模态发展”的关键阶段。9月底的2025云栖大会上,阿里云智能集团首席技术官、通义实验室负责人周靖人曾透露,连续发布数十款模型背后有明确的战略考量:全球AI模型进展都在加速,整个通义家族一直在与全球领先者你追我赶,AI已进入加速期,比拼的是模型迭代效率;同时,从单模态到多模态的演进是必然趋势,阿里期待在多模态方面实现进一步的创新与突破。在这样的背景下,许主洪正是最合适的牵头人选。

许主洪本人对多模态大模型的发展方向早有洞见。在5月的蚂蚁技术开放日上,他提出,用统一的框架实现理解与生成,是发展多模态大模型的一大演进趋势。不过他也坦言,这一领域目前仍处于初级阶段,需要大量的实践来验证。

▲许主洪在讲解统一多模态模型产业发展脉络

他进一步指出,统一理解与生成的多模态大模型面临诸多技术挑战。在全模态交互方面,当前支持音、视、图、文全模态交互的公开单模型极为罕见;在理解与生成的统一方面,图像和语义的统一模型更是寥寥无几,且两者效果往往难以平衡。在6月的演讲中,他更是直言:“多模态Agent AI时代才刚刚开始。未来要真正达到AGI,还需要解决很多技术难题——多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制……每一项都是不小的挑战,但这也正是多模态大模型行业的巨大机遇。”

截至目前,阿里及许主洪方面均未对此事进行公开置评。但无论最终官方消息如何,这一人才流动的动向本身,已经释放出强烈的信号。

来源:https://www.aiagiai.com/14958.html
上一篇DeepSeek最新模型上线,全新注意力机制源自北大ACL最佳论文 下一篇Anthropic 发布重磅更新引关注
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
RAG四标融合企业知识资产体系四库协同GEO优化实践
AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略,在大模型的内容采信规则下已经基本失效。取而代之的,是生成式引擎优化(GEO)。它不再关注外链数量,而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG(检索增强生成)架构真正看重的核心指

一个普通上班人分享WorkBuddy使用心得与真实体验
AI教程 · 2026-07-01

一个普通上班人分享WorkBuddy使用心得与真实体验

前言 最近我开始使用WorkBuddy——这是腾讯推出的一款AI办公工作台。差不多用了一周时间,趁印象还新鲜,把真实的使用感受记录下来,给还在犹豫的朋友做个参考。不吹不黑,只说实际体验。 初印象:不只是聊天机器人 之前用过不少AI工具,大多数就是个对话框,你问它答,答完就结束了。WorkBuddy不

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录
AI教程 · 2026-07-01

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录

先讲一个颇具戏剧性的开端。 这件事的开端颇显荒诞——有用户前来咨询,称AI Pro版的介绍中提到我们有一款“视频录制拓展”。团队全体成员都感到困惑,翻遍产品列表,发现根本不存在该组件。AI那种“一本正经胡说八道”的能力,这次确实让我们陷入尴尬。 按常理,此事到此便可结束——一句“抱歉,暂时没有这个拓

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同
AI教程 · 2026-07-01

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同

OLAP和SQL-on-Hadoop虽都使用SQL查询数据,但本质不同。SQL-on-Hadoop负责海量数据批量计算与ETL,查询速度秒级至分钟级;OLAP通过预聚合实现毫秒级多维分析,适合BI报表。两者在数据平台分工协作,前者是后厨加工,后者是前台快速服务。

GEO优化深度解析:AI偏好FAQ还是长文内容?
AI教程 · 2026-07-01

GEO优化深度解析:AI偏好FAQ还是长文内容?

在GEO优化中,AI对内容形式无统一偏好:FAQ在简单查询中引用率41%,长文在复杂查询中达58%。内容应基于用户意图选择形式,FAQ适配简单事实类问题,长文建立主题权威,两者互补而非替代。