清华数学大神跳槽OpenAI!主导SAM与Llama开发实战揭秘
henry 发自 凹非寺
量子位 | 公众号 QbitAI
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
又一位清华大神加入OpenAI!
刚刚,毕业清华大学数学系,曾在Meta FAIR工作3.75年、主导过SAMLlama多项核心工作的研究员张鹏川(Pengchuan Zhang)宣布离职。
他的下一站,是来到OpenAI,投身于世界模拟与机器人学(World Simulation and Robotics)方向的研究。
他在推特中写道,自己非常期待探索视觉感知、世界模型与机器人技术如何融合,构建真正的“物理智能”。

OpenAI世界模拟方向的负责人之一、Sora项目资深领导Aditya Ramesh也第一时间留言欢迎。

从视觉理解到底层世界模型,这一步转向本身就很有意味。

那么,这位曾站在SAM与Llama核心位置的研究员,究竟是谁?
张鹏川是谁?
2007年,张鹏川从重庆市南开中学高中毕业,考进清华大学,主修数学。

本科毕业后,他前往美国加州理工学院(Caltech)攻读博士,于2017年获得应用与计算数学博士学位。
博士期间,他专注于机器学习理论与应用,开始探索深度学习在视觉领域的潜力。

博士毕业后,他加入微软研究院,并在Microsoft Research雷德蒙德担任首席研究员。

期间,他领导了雷德蒙德实验室的计算机视觉与多模态智能研究工作。
同时还在微软内部跨组织推动计算机视觉与多模态智能项目,包括Alexandar Multi-Modal和Florence等方向。
值得一提的是,他在2024年还加入了华盛顿大学,担任电气与计算机工程系的兼职助理教授至今。

2024年起,他转入Meta FAIR(现Meta超级智能实验室),研究计算机视觉与多模态智能,累计工作近4年。
在此期间,他主导多项开创性项目,包括:
担任Segment Anything 3(SAM 3)项目负责人:SAM 3是一个统一框架,可在图像和视频中实现目标检测、分割与跟踪。
作为SAM系列最新迭代(2025年11月),该模型推出统一框架,支持图像和视频中的目标检测、分割与跟踪,实现零样本泛化到任意物体和场景。

担任Llama 3视觉 grounding项目负责人,主导输入侧视觉 grounding能力建设,使Llama 3成为首个在Visual Commonsense Reasoning(视觉常识推理)基准上达到人类水平的开源模型。
担任Llama 4视觉grounding项目负责人,延续Llama 3优势,进一步强化专家级图像grounding能力(如像素级定位与复杂场景理解),被视为Llama 4对标GPT-4o的关键差异化亮点。
这些工作不仅提升了Meta的生成式AI竞争力,还为开源社区贡献了高影响力工具。
截至目前,张鹏川谷歌学术被引高达34659次!

One more thing
在张鹏川的推特下方,一位网友忍不住发问:
为什么突然之间所有人都在加入 OpenAI?我是挺兴奋的,但这是为什么?

这个疑问,其实并不突兀。
自2025年底以来,已经有多位业内知名人物陆续加入 OpenAI——
括姚班大神陈立杰,Roblox高管Arvind KC,《性能之巅》作者Brendan Gregg,以及从Thinking Machines Lab回流的Barret ZophLuke MetzSam Schoenholz等人。
与此同时,前段时间刷屏的xAI离职潮,也让不少人猜测——
OpenAI会不会成为这些顶尖研究者的下一站?
对此,评论区有位网友回复得很直接:
因为(OpenAI)有算力+Sora级别的世界建模基础设施。如果没有这两样,到2026年几乎不可能做出真正高水平的机器人系统。

如果这条判断成立,那么张鹏川的选择,或许不只是一次个人职业转向。
也是OpenAI今年对“世界模型 + 物理智能”路线的下注。
让我们期待鹏川在OpenAI的工作!
[1]https://pzzhang.github.io/pzzhang/
[2]https://scholar.google.com/citations?hl=zh-CN&user=3VZ_E64AAAAJ&view_op=list_works
[3]https://x.com/PengchuanZ/status/2026189659228012558?s=20
相关攻略
微软发布多模型智能体扫描框架MDASH,采用超百个专用AI智能体协同工作,显著提升漏洞检测精度与效率。在公开测试中表现超越GPT-5 5等模型,发现16个新漏洞;私有测试实现100%识别率且零误报。该系统已应用于内部安全加固并开启受限预览。
微软推出多模型智能体扫描框架MDASH,集成超百个AI智能体协同工作,高效分配漏洞扫描任务。测试中,该系统成功识别多个未知高危漏洞,实现100%识别率且零误报,已应用于内部安全加固,展现出高历史漏洞回收率,标志着AI在代码安全领域的重要工程落地。
微软近日证实,Windows系统更新存在一个长期问题:会自动将用户从芯片厂商官网手动安装的最新显卡驱动,替换回更旧的OEM版本。其根源在于当前宽泛的四段式硬件ID匹配机制,系统会将官方推送的驱动判定为“最高优先级”,无视用户已安装的更高版本。这导致性能下降和软件兼容性问题,引发大量用户投诉。作为解决
《微软模拟飞行2020》因高度拟真和全球动态地景备受喜爱,但常因网络波动导致云端数据加载失败,引发闪退,尤其在偏远地区或多人联机时更明显。优化网络连接、使用可靠加速工具可有效降低延迟与丢包,减少闪退。建议尝试相关产品的免费体验,以稳定网络环境,保障流畅飞行。
5月11日世界密码日之际,微软在其官方博客发布了一项重要声明,预示着依赖传统密码进行身份验证的时代可能即将落幕。这家科技巨头明确指出,面对日益复杂的网络威胁环境,特别是由人工智能驱动的钓鱼攻击和凭证泄露事件层出不穷,传统密码已成为当前在线安全体系中最薄弱的环节。 为此,微软正全力推动用户转向更为安全
热门专题
热门推荐
本文梳理了2026年主流数字资产交易平台的特点与选择策略。重点从安全性、资产丰富度、交易体验、创新功能及合规性等维度进行分析,旨在帮助用户根据自身需求,在众多平台中做出明智选择,而非简单罗列排名。选择平台需综合考量资金安全、操作习惯与长期发展愿景。
本文梳理了2026年现货交易所的竞争格局,从交易深度与流动性、资产安全与合规性、用户体验与产品创新三个维度进行深度分析。文章指出,头部平台在合规与技术创新上持续领跑,新兴交易所在细分市场寻求突破,行业整体呈现出专业化、合规化与用户体验并重的发展趋势,为不同需求的用户提供了多元选择。
本文梳理了2026年主要数字资产交易平台的综合表现,从安全性、资产多样性、用户体验及创新服务等维度进行分析。榜单反映了行业向合规与专业化发展的趋势,头部平台在技术架构与风控体系上持续投入,新兴平台则凭借细分领域创新获得关注。投资者需结合自身需求,理性评估平台特点与风险。
今年四月,AI网络初创公司Aria Networks携1 25亿美元融资高调登场,并向业界抛出了一个直指核心的判断:下一阶段AI基础设施的竞争,焦点已不仅仅是堆砌更多的GPU,而在于能否构建一个能充分释放这些算力潜能的“神经网络”。 这家由前Arista和Juniper高管创立、总部位于帕洛阿尔托的
仅凭一张家用RTX 4090显卡的24GB显存,就能流畅运行一个拥有320亿参数的AI大模型,一口气读完6份长文档并自动生成周报?这并非极客魔改,而是来自MIT、英伟达与浙江大学研究者的最新突破。 这项名为TriAttention的技术,精准瞄准了大模型推理中的核心瓶颈——KV缓存显存占用。其核心思





