据36氪独家获悉,阿里通义千问大模型技术负责人周畅(花名:钟煌)已决定从阿里云离职,并计划启动个人创业项目。

截至目前,周畅仍为阿里云在职员工,尚未完成离职手续。但据多个独立信源交叉印证,其创业意向已十分坚定。有知情人士透露,他此次极可能将目光投向AI应用领域。
另一消息源指出,作为通义实验室算法团队的核心技术骨干,周畅此次离职属正常人事变动。通义大模型的研发与开源工作仍在有序推进,目前通义实验室的汇报关系仍直接对接阿里云CTO周靖人。
截至发稿,36氪就此事向阿里云方面求证,尚未获得回应。
下面梳理周畅的履历:2012年从复旦大学计算机科学与技术专业本科毕业后,他进入北京大学攻读博士学位,于2017年获计算机软件与理论专业博士学位,随后加入阿里巴巴。从达摩院算法专家起步,逐步晋升为通义千问大模型负责人。其核心研究方向涵盖深度学习、图挖掘及分布式计算,已在机器学习、数据挖掘、数据库等国际顶级会议发表30余篇论文,并长期担任NeurIPS、ICML、KDD、WWW等学术会议的审稿人。
在国内科技巨头中,阿里巴巴是最早系统性布局大模型研发的企业之一。2019年基于BERT范式推出预训练大语言模型structBERT,2021年发布多模态大模型M6,随后逐步构建起完整的通义大模型家族——这一发展脉络十分清晰。
达摩院旗下的通义实验室,如今已被业界视为大模型领域的“人才高地”。此前官宣创业的前字节模型技术研发负责人杨红霞、已加入Salesforce的前实验室负责人司罗、通义视觉实验室负责人徐盈辉等顶尖AI人才,均出自达摩院体系。可以说,这里堪称阿里大模型团队的黄埔军校。
周畅则是完整见证了阿里大模型从零到一成长历程的核心技术骨干。2020年至2021年间,他带领团队设计并实现了超大规模多模态预训练模型M6,在参数规模与低碳训练模式方面均实现了突破性探索。
往前追溯,他还主导研发了超大规模商品图表征算法APP、用户表征框架ATRank,以及基于自监督对比学习的向量召回算法CLRec系列。这些技术并非纸上谈兵——在手淘多个推荐场景落地后,显著提升了业务效果。
进入2024年,国内大模型行业已完全走出萌芽阶段,基础大模型层的竞争格局趋于稳定。主要玩家阵营清晰:大厂阵营包括阿里、字节、腾讯;创业公司则有智谱AI、Minimax、月之暗面、百川智能等。市场目光已转向AI应用层面——关注大模型如何切实落地行业与场景,这一趋势必将催生新一轮AI人才的创业热潮。
