首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Qwen与深势科技背后,揭秘同一位创始人的AI征途

Qwen与深势科技背后,揭秘同一位创始人的AI征途

热心网友
98
转载
2026-03-12



有这么一个人,他姓周,入职过阿里,和林俊旸有渊源,做的产品这两天还特别火。

没错,他不是阿里的周浩,而是已经在字节主导Seedance等多模态业务的周畅。

周畅在阿里的七年时间里,是通义千问大模型的技术负责人。

在他的参与下,Qwen从2024年4月首次亮相,一路走到了全球开源大模型的第一梯队。

2024年6月他离职前夕发布的Qwen2,性能全面超越当时的开源标杆Llama 3-70B,发布两小时即冲上hugging Face开源大模型榜单第一,也超过了国内一众闭源大模型。

现如今,Qwen系列在全球最大的开源AI模型社区Hugging Face上,其衍生模型数量突破20万个,累计下载量超过10亿次,是全球下载量最大的开源大模型系列。

今年2月发布的Qwen3.5,更是包揽了Hugging Face全球开源大模型榜单前四名,千问App月活用户达到2.03亿。

2024年夏天他离开阿里,加入字节跳动Seed团队。

入职不到一年,他接管了Seedream和Seedance,以及世界模型团队等,成为Seed多模态方向的最高负责人。

后面的故事就广为人知了。2026年2月7日,Seedance 2.0 低调上线,没有发布会、没有大规模宣传,却在三天内引爆全球科技圈与资本市场。

A股短剧概念股集体涨停,《黑神话:悟空》制作人冯骥直言它是“地表最强视频生成模型,没有之一”。

放眼整个中国AI行业,很难再找出第二个人有周畅这样的履历。

01

周畅其人

周畅的本科来自于复旦大学计算机科学与技术专业,2012年毕业后进入北京大学,花了五年拿下计算机软件与理论方向的博士学位。

博士期间的研究方向是深度学习、图挖掘与分布式计算,论文发了不少,顶会收录了三十余篇2017年7月,他通过校招加入阿里巴巴,花名“钟煌”。

校招生进大厂,成长路径其实都要经历一段“新手村”。

周畅最初被分配到达摩院智能计算实验室,做算法专家。那几年他做的事情跟大模型没什么关系。

周畅负责研发商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec,这些系统主要服务于阿里电商的推荐与搜索场景。



事后来看,这几年的积累对他后来的职业轨迹至关重要。

一方面,他在阿里最核心的电商业务里完成了大规模工程落地的训练,知道怎么把实验室里的算法落地。

另一方面,他在这个过程中结识了一支愿意跟他走的核心团队。

2020年前后,周畅的工作方向开始转变。

阿里达摩院启动了一个叫做Multi-Modality to Multi-Modality Multitask Mega-transformer(多模态到多模态多任务超大规模Transformer模型)的项目,下文简称M6。

这个项目由阿里与清华大学联合推出。周畅是这个项目的核心参与者,与他一起署名的还有两个后来在千问故事里反复出现的名字:林俊旸和周靖人。

2024年3月,M6正式发布,参数规模1000亿,是当时全球多模态预训练领域最大的模型。3个月后,达摩院进一步将M6推到了万亿参数级别,并且在训练效率上做了大幅优化。

与同等规模的模型相比,M6的能耗降低超过八成,效率提升近11倍。

M6在中文场景下实现了文本与图像等多模态的统一预训练,构建了一个超过1.9TB图像和292GB文本的大规模中文多模态数据集,覆盖百科、网页、商品描述等多种场景。

这套方法论后来被直接应用到阿里的电商推荐和内容生成业务中,M6-Rec等衍生工作在阿里集团内部获得了广泛部署。

论文发表于KDD 2024这类的顶会上,周畅与林俊旸、周靖人共同署名。

还有一点很重要,M6也是Qwen在多模态方面的技术前身。

2024年,ChatGPT在全球范围内引发大模型热潮,阿里迅速整合达摩院资源组建通义实验室。周畅在M6的技术基础上带队研发通义千问大模型,担任技术负责人,直接向阿里云CTO周靖人汇报。

接下来的一年多时间里,周畅团队先是在2024年8月首次开源Qwen-7B,此后陆续推出Qwen-VL视觉语言模型Qwen-Audio音频理解模型、CodeQwen代码模型,以及Qwen1.5-MoE混合专家模型,覆盖了文本、视觉、音频、代码等多个模态方向。

2024年6月,也就是周畅离职前夕,千问团队发布了Qwen2。前文提到了,Qwen2取得了巨大的成功,也让阿里在整个开源模型界获得了不小的名声。

截至目前,周畅的论文累计被引用超过30000次。其中引用最多的一篇就是Qwen2技术报告,被引用次数超过 8000 次。

如果学术论文也按微信公众号的文章那么算,这篇大概可以理解为是10万+。

到周畅离开时,通义千问开源模型的累计下载量已突破700万次。

千问能走到今天,离不开周畅搭建的那套从M6延续下来的技术根基。

02

Seed多模态掌门

2024年7月,网传周畅即将离职创业。

当时他还在阿里云系统中,尚未正式走完流程,但多个独立信源确认他已经决定要走。离职时,他还签署了竞业协议。

然后事情的发展出乎所有人意料。

仅仅两个多月后的10月,周畅就被曝出已经低调加入字节跳动。不是创业,是跳槽,而且跳到了阿里最直接的竞争对手那里。

字节给周畅开出的条件4-2职级(也有知情人称其现在职级为5-1)、八位数年包。

换算成阿里职级,这大约相当于连跳两级、薪资也翻好几倍。随行的团队成员也拿到了4-1、3-2的职级。

2024年11月,阿里正式申请竞业仲裁的消息传开,接近通义的业内人士确认“情况属实”。

“辞职创业就是个幌子,就是怕被竞业,”一位和字节关系很近的猎头,在此前接受第一财经采访时这样说道。“但这次瞒不住了,来字节的不止周畅一个人,他手底下的团队还有十多个人也跟着跳槽了。”



截至2026年3月,这起劳动仲裁的最终审理结果、赔偿裁定等核心信息,涉事的两家AI巨头、包括周畅本人从未对外公开披露。

劳动仲裁案件以不公开审理为法定原则,双方均未发布案件细节。目前能确认的只是阿里提起仲裁后,案件已按法定流程完成审理。

加入字节后,周畅被安排在Seed团队的“多模态交互与世界模型”部门。

Seed是字节跳动的大模型与基础研究团队,也是整个公司在AI方向上最受重视的业务之一,对周畅来说也属于是老本行了。

2025年2月,一个重要人物的到来改变了Seed的格局。前谷歌DeepMind研究副总裁、谷歌最高职级L10的谷歌Fellow吴永辉加入字节,担任Seed基础研究负责人,直接向CEO梁汝波汇报。

吴永辉是南京大学校友,在谷歌工作了17年的老将,曾主导谷歌神经机器翻译系统GNMT的研发,也参与了Gemini大模型的工作。

吴永辉的到来重构了Seed团队的汇报架构,多名算法和技术负责人被重新安排向吴永辉汇报,其中就包括周畅。

从后来的发展来看,吴永辉是非常看重周畅的。

2025年7月,字节豆包视觉多模态生成负责人杨建朝宣布“暂时休息”。杨建朝师从被称为“计算机视觉之父”的黄煦涛,在字节负责文生图、文生视频等视觉AI方向。最新消息显示,他正在视频模型领域启动创业。

他休假后,周畅正式接手了这块业务。紧接着,视觉基础模型研究负责人冯佳时也离职。

两次人事变动叠加,周畅的管辖范围从原来的多模态交互和世界模型,扩展到了文生图Seedream、文生视频Seedance等全线视觉AI产品。至此,他已经成为Seed团队中多模态方向的主要负责人。

03

推出Seedance 2.0震惊世界

接手视觉全线之后,周畅团队把Qwen时期的高密度产出模式带到了Seed里。

文生图方向,团队完成了Seedream从3.0到4.0再到5.0的快速迭代。

Seedream 3.0实现了原生2K输出和3秒级生成速度,Seedream 4.0将分辨率推至4K并统一了生成与编辑架构,2026年2月发布的Seedream5.0 进一步引入了物理感知和语义推理能力。

文生视频方向的成果更是显著。

文章开头就提到,Seedance 2.0在2026年2月7日低调上线,其带来的影响却远超预期。

Seedance 2.0支持原生2K分辨率、多镜头叙事、四模态输入(文本+图像+视频+音频)、多语种口型同步等专业级功能。

经过实际测算,一个5秒特效镜头的制作成本,可以从3000块钱(人力一个月)降至3块钱(AI两分钟)。

短剧行业也因此被改写成为“AI短剧行业”,DataEye预估,受AI技术降本增效的推动,2026年国内漫剧用户规模将从2025年的约1.2亿增至2.8亿。

值得一提的是,最新消息显示,此前离职的Qwen大模型后训练负责人郁博文,已正式加入字节跳动,担任Seed团队视觉模型与多模态交互团队后训练负责人。

这位Qwen来的后辈,与周畅在Seed再一次携手共事。

事实上,Seed团队近年来,一直都有阿里相关业务的核心团队成员转身来投,这一趋势可以追溯到周畅入职的数年前。

例如,曾在阿里负责拍立淘等项目、担任视觉搜索负责人的黄伟麟,在2020年前后离开阿里并加入字节视觉与多模态研究体系;

阿里前语音AI负责人卢璐则2024年前后加入字节,负责语音与多模态大模型研究;

此外,曾在达摩院从事文档理解与多模态研究的叶清浩,在2024年前后离开阿里,其学术主页目前显示任职于字节Seed团队。

换言之,字节的多模态研究体系里,阿里来的“外援”还真不少。

来源:https://www.163.com/dy/article/KNRDNG2305399DAP.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
科技数码
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越

热心网友
05.18
具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Mac清理Safari自动填充记录教程 保护苹果隐私安全
系统平台
Mac清理Safari自动填充记录教程 保护苹果隐私安全

在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过

热心网友
05.19
关闭Windows自动维护功能 解决电脑空闲时CPU占用过高问题
系统平台
关闭Windows自动维护功能 解决电脑空闲时CPU占用过高问题

你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整

热心网友
05.19
Win11高对比度模式开启教程 弱视用户屏幕显示优化指南
系统平台
Win11高对比度模式开启教程 弱视用户屏幕显示优化指南

如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏

热心网友
05.19
Mac关闭Spotlight索引的详细步骤与禁用设置技巧
系统平台
Mac关闭Spotlight索引的详细步骤与禁用设置技巧

当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围

热心网友
05.19
Mac清理Microsoft Teams缓存详细步骤指南
系统平台
Mac清理Microsoft Teams缓存详细步骤指南

当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓

热心网友
05.19