达摩院M6大模型负责人杨红霞离职系个人原因
近日,人工智能行业出现一项重要人事变动。根据公开信息,阿里巴巴达摩院智能计算实验室资深算法专家、M6大模型原负责人杨红霞,已于今年9月初因个人家庭原因离职。
杨红霞的职业生涯,展现了顶尖AI技术人才的典型成长路径。她于2007年毕业于南开大学统计学专业,随后赴美国杜克大学统计科学系深造,师从David Dunson教授并获得博士学位。毕业后,她先后在IBM全球研发中心担任Watson研究员,在雅虎担任首席数据科学家,积累了深厚的工业界研发经验。
2016年,杨红霞结束在美国近十年的学习与工作,回国加入阿里巴巴。在达摩院期间,她长期专注于可大规模产业化落地的人工智能技术,并带领团队探索被视为下一代AI突破方向的认知智能领域。
她领导的团队研发了包括AliGraph、M6、洛犀等在内的一系列具有行业影响力的人工智能开源平台与系统。团队在顶级会议与期刊上发表论文超过100篇,申请中美专利超过30项,并屡获殊荣:2019年获得世界人工智能大会最高奖SAIL奖,2020年斩获国家科学技术进步奖二等奖及杭州市创新领军团队称号。杨红霞本人也于2022年6月入选福布斯中国科技女性50榜。
在她众多成就中,大模型M6无疑是最为瞩目的成果。据了解,杨红霞此次离职纯属个人家庭原因,达摩院M6团队的后续研发工作将正常推进。
M6:从千亿到十万亿的突破之路
M6模型于2021年3月首次亮相,是国内首个公开的千亿参数多模态大模型。其发布在业界引起广泛关注,连OpenAI前政策主管Jack Clark都曾评价,该模型的规模与设计“非常惊人”,体现了中国AI研究机构的快速成长。
作为通用AI大模型,M6具备多模态理解与多任务处理能力,在设计、写作、问答等场景表现优异,在电商、制造、文创、科研等领域拥有广阔应用前景。杨红霞曾指出,多模态预训练是下一代人工智能的基础,而M6在训练效率与生成精度上的多项突破,使其成为当时众多中文多模态下游任务的最优模型。
团队的创新步伐持续加速。2022年6月,杨红霞团队发布了参数规模达万亿级别的M6模型。其关键突破在于训练效率——仅使用480块GPU就实现了万亿参数智能运算,相比之前的百亿参数模型,功耗降低80%,效率提升11倍。
仅四个月后,纪录再次刷新。团队使用512块GPU,在10天内成功训练出参数规模高达10万亿的模型。这一规模与当时知名的GPT-3模型相当,但训练能耗仅为后者的1%。这一成就将高效低碳的大模型训练技术推向全新高度。
目前,M6模型已实现成功落地应用。它不仅服务于阿里巴巴内部近50个业务部门,在阿里新制造平台“犀牛智造”中发挥作用,也通过阿里云对外提供技术服务。其技术突破被收录于《麻省理工科技评论》2021年度中国AI突破技术报告。
杨红霞的离职,是其个人职业生涯的一个节点。而她与团队在M6模型上留下的技术足迹——从千亿到十万亿参数的跨越,以及对训练能效比的极致追求,已成为中国AI大模型发展历程中一个鲜明的里程碑。
热门专题
热门推荐
在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c
登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而
GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。
在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱
宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并





