首页 游戏 软件 资讯 排行榜 专题
首页
AI
MIT博士毕业即加盟OpenAI,前CTO高薪邀约,年薪三百万起步

MIT博士毕业即加盟OpenAI,前CTO高薪邀约,年薪三百万起步

热心网友
68
转载
2026-01-09


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:桃子

【新智元导读】MIT天才博士,清华学霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型预训练。

MIT天才博士一毕业,火速加盟OpenAI前CTO初创!

最近,肖光烜(Guangxuan Xiao)在社交媒体官宣,刚刚完成了MIT博士学位。

下一步,他将加入Thinking Machines,专注于大模型预训练的工作。


评论区下方,英伟达科学家、xAI研究员、UCSD等一众大佬,为他本人送上了祝贺。



清华双学位学霸,MIT博士开挂人生

打开他的个人主页,多元而充实的经历便映入眼帘。

肖光烜本科毕业于清华大学,拿到了双学位,主修的是计算机科学,金融学是第二学位。


在此期间,他获得了清华大学综合优秀奖学金(2019)、全国大学生数学建模竞赛(CUMCM)一等奖(2020)、国家奖学金(2020)、清华大学「未来学者」奖学金(2024)等多项奖项。

他曾于2020–2024年作为访问生(Visiting Student),前往斯坦福大学计算机系开展科研工作。

2024年,肖光烜加入MIT攻读博士学位,导师为韩松(Song Han)教授。

个人研究方向聚焦于:深度学习的高效算法与系统,尤其是大规模基础模型(Foundation Model)。


他于2024年9月至2026年1月,在MIT EECS担任全职研究助理(Research Assistant)。

读博期间,肖光烜曾多次进入全球顶级科技大厂从事前沿研究实习,具备了丰富的一线工业研发的经验。

2024年,他曾加入Meta实习,研究方向为「流式语言模型的高效注意力机制」,相关成果发表在arxiv上。


论文地址:https://arxiv.org/pdf/2309.17453

2024年2-5月期间,他作为英伟达实习生,研究方向是为长上下文大语言模型推理加速。

他和团队提出了DuoAttention,结合检索与流式注意力头,实现高效推理。


论文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

随后,他又参与了多项核心研究项目,其中包括:

XAttention:基于反对角评分的块稀疏注意力机制

StreamingVLM:面向无限视频流的实时理解模型

FlashMoBA:混合块注意力(Mixture of Block Attention)的高效优化

值得一提的是,肖光烜在研究之外,还有丰富的兴趣爱好,比如足球、乒乓球、围棋、钢琴。

他曾担任所在院系足球队的队长兼先锋,贝多芬的作品是个人最爱。


一篇博士论文,破解LLM三大难题

比起耀眼的履历,肖光烜的博士论文本身更值得深入研析与拆解。


不得不承认,如今大模型已经无所不能,但它们依然太贵了。

显存爆炸、推理太慢、长上下文直接OOM(内存溢出),这是几乎所有LLM工程团队每天都在面对的现实。

Efficient Algorithms and Systems for Large Language Models这篇论文,给出了一个罕见的、从工程到理论、从算法到架构的完整答案。

论文中, 他们提出了SmoothQuant,解决了一个长期困扰工业界的问题——激活值异常(activation outliers)。

SmoothQuant通过一个巧妙的数学等价变换,把量化难点从「激活」转移到「权重」。

结果,它实现了首个在十亿级模型上W8A8无损量化,无需重新训练,显存更小、推理更快。

针对超长序列的处理,作者在StreamingLLM中发现了「注意力汇点」(attention sink)现象——

即使没有任何语义,初始token会被后续token持续关注。这些token的作用不是「理解」,而是数值稳定。

结果,实现了常数内存的流式推理,模型上下文长度从数千token扩展到百万级。

更进一步,他们又把这一思想推广到多模态,StreamingVLM可以在保持时间一致性的同时处理长达数小时的视频内容。

对于超长上下文场景,团队又提出一个互补方案,分别针对不同的性能瓶颈。

KVCache太大,采用DuoAttention

注意力头本身就有分工:少数负责「全局检索」,多数只看「最近上下文」。

DuoAttention用混合策略,大幅降低显存,却几乎不掉性能。

预填充(Prefill)太慢,采用XAttention

利用反对角线评分机制,仅识别、计算必要的注意力块,从而实现显著的加速效果。

论文的最后,并没有止步于「优化现有模型」,通过对MoBA(块混合注意力) 的信噪比分析,作者证明了:

理论上,block越小越好。

但现实是,GPU不答应,于是有了FlashMoBA,一种定制化的CUDA内核,使小块架构在实践中可行,并实现了最高可达9倍的速度提升。

这篇论文的价值在于,构建了一整套高效大模型的完整框架,既回应了当下的现实挑战,也为下一代计算高效、普惠可及的AGI奠定了基础。

平均350万年薪,碾压OpenAI

最后来到一个大家比较感兴趣的话题——薪资。

去年,硅谷人才争夺战激烈,BI一篇独家挖到了Thinking Machines(TML)给员工们开出的薪资——

基础年薪高达50万美元(约350万元)。


据BI获取的招聘数据,TML向两名技术员工支付了45万美元的基础年薪,另一名员工的年薪则高达50万美元。

第四名员工被列为「联合创始人/机器学习专家」,其年薪同样为45万美元。

这些薪酬数据,来自2025年第一季度,早于Murati以100亿美元的估值,成功完成20亿美元的种子轮融资。

总体来看,TML为这四名技术员工提供的平均年薪达到462,500美元。

相较之下,TML明显高于业内更为成熟LLM公司——

OpenAI在相关申报文件中列出的29名技术员工,平均年薪为292,115美元。

其中最高薪资为53万美元,最低为20万美元。

Anthropic向14名技术员工支付的平均年薪为387,500美元,薪资区间在30万至69万美元之间。

虽然比起Meta疯狂的超1万亿美元薪酬还差得远,但这一水平也在硅谷数一数二。

果然,21世纪最贵的还是人才。


参考资料:

https://x.com/Guangxuan_Xiao/status/2008779396497502337

https://guangxuanx.com/

https://scholar.google.com/citations?user=sRGO-EcAAAAJ

https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!


来源:https://www.163.com/dy/article/KIR0Q9DB0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

00后交大博士造飞行机器人,融资超千万,交大投了
AI
00后交大博士造飞行机器人,融资超千万,交大投了

机器人前瞻(公众号:robot_pro)作者|葛文婷编辑|漠影机器人前瞻4月3日报道,昨日,专注于具身智能仿生扑翼机器人的鹰瞰智翼宣布完成天使轮融资,累计融资金额达数千万元。据悉,该公司已在一年内连

热心网友
04.07
中科院自动化所博士夏中浈加盟无界动力,出任联合创始人兼CTO
科技数码
中科院自动化所博士夏中浈加盟无界动力,出任联合创始人兼CTO

北京商报讯(记者 陶凤 王天逸)3月29日,无界动力对外宣布,夏中谱正式加入公司,担任联合创始人兼联席CTO,全面负责世界模型原生具身智能多模态大模型研发,以及数据闭环、云端仿真等核心技术基础设施建

热心网友
03.31
AI与基础科研融合的三大关键问题解析
科技数码
AI与基础科研融合的三大关键问题解析

(来源:麻省理工科技评论)好奇心驱动的研究长期以来一直是技术变革的火种。一个世纪前,对原子的好奇催生了量子力学,并最终孕育出现代计算核心的晶体管;反过来看,蒸汽机是一项实用的突破,但人们在热力学领域

热心网友
03.15
斯坦福家务机器人融资11亿:华人博士4个月造出独角色兽
AI
斯坦福家务机器人融资11亿:华人博士4个月造出独角色兽

henry 发自 凹非寺量子位 | 公众号 QbitAI“这笔钱只有一个目的:不再只做demo。”刚刚,由斯坦福具身智能明星赵子豪(Tony Zhao)迟宬(Cheng Chi)创立的机器人公司Su

热心网友
03.13
浙大教授与95后博士手搓全球最快机器人,追赶波士顿动力
科技数码
浙大教授与95后博士手搓全球最快机器人,追赶波士顿动力

作者丨巴里编辑丨吴岩图源丨镜识科技2026开年,镜识科技创始人王宏涛深夜风尘仆仆地赶到北京,第二天要去见几个合作伙伴。他是浙江大学求是特聘教授、国家杰出青年基金获得者,如今也是镜识科技的联合创始人。

热心网友
03.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币重探7万美元,市场已全面消化美伊战争风险?
web3.0
比特币重探7万美元,市场已全面消化美伊战争风险?

清明节假期期间,A 股和港股休市,但比特币行情永不停歇。 4月6日,当多数市场还在假期中沉睡时,比特币已经悄然启动。价格从亚洲早盘的低点67400美元出发,一路向上试探,盘中最高涨破70300美元,不仅刷新了3月26日以来的高位,较日内低点的涨幅也超过了4%。以太坊的表现同样不俗,从2050美元附近

热心网友
04.07
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰
网络安全
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰

4月5日消息,日前,REDMI K90至尊版通过3C认证,预计将于本月发布。今日,小米中国区市场部总经理魏思琪用小米新机发布微博,不出意外,这正是即将登场的REDMI K90至尊版,这将是小米首款配

热心网友
04.07
WPS动态交互图表制作指南:让数据变化直观呈现
电脑教程
WPS动态交互图表制作指南:让数据变化直观呈现

WPS演示中图表不随数据更新时,可通过四种方法实现自动同步:一、用OFFSET+COUNTA定义动态名称绑定图表;二、用组合框控件联动VLOOKUP提取数据;三、用数据透视图配合切

热心网友
04.07
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
科技数码
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

热心网友
04.07
天上的马桶与地上的火药桶,都在让美国出糗
科技数码
天上的马桶与地上的火药桶,都在让美国出糗

太空中的马桶堵了,边飞边修还能勉强用。但中东被点燃的火药桶,美国怎么来扑灭?靠一再延期的“最后通牒”?还是靠无底线的轰炸?2300万美元的马桶美国航空航天局4名宇航员1日搭乘“猎户座”飞船升空,执行

热心网友
04.07