首页 游戏 软件 资讯 排行榜 专题
首页
AI
GPT-5发布华人团队揭秘:清北校友核心贡献深度解析

GPT-5发布华人团队揭秘:清北校友核心贡献深度解析

热心网友
47
转载
2025-12-12


新智元报道

编辑:Aeneas

【新智元导读】号称满分屠榜的GPT-5.2,一发布就降智了?许多网友现身表示,似乎确实比开始弱了很多。但提前实测的网友表示,它的确很强,甚至当得起GPT-6之称!

昨夜,OpenAI放出了GPT-5.2炸弹。

根据最新公布的基准测试,它几乎完全碾压Gemini 3 Pro。

GPT-5.2最擅长帮人们完成有经济价值的任务,比如做电子表格、做PPT、写代码和审查代码、分析长文档等等。

而且号称在GDPval等基准测试中,有70.9%的时间能追赶甚至吊打专业人士。

可以说,这是OpenAI进入红色预警,甚至不惜改变AGI目标,都要完成的一个产品,而且还身负着狙击Gemini 3的重任。


所以,GPT-5.2实测起来,体感究竟如何?

GPT-5.2实测:一上线就降智?

出乎意料都是,一个GPT-5.2实测翻车的帖子,在X上火了。

如果向它提问:「garlic」中有多少个R?它会回答:0个。


相比之下,其他模型的表现就要稳定得多。


归根结底,这是LLM的一个底层问题:因为tokenization而无法统计字母数量。

不过,只要强制选到Thinking版本,GPT-5.2就能答对这个问题了。



在reddit上,也有很多网友表示:在GPT-5.2刚发布的时候,似乎功能还很强。

结果几个小时后,它紧接着就降智了。


有人表示,自己早上八点半开始用的时候还好好的,喝完一杯咖啡后,GPT-5.2忽然就不行了。


似乎每次新模型一发布,几小时后就会被削弱,OpenAI这是什么操作?


大佬现身说法:还是挺强的

不过这点小插曲,还是没有影响坊间的正面评论。

昨晚GPT-5.2一发布,网友们就被震撼了。

比如有人说,ARC-AGI 2的这次飞跃属实疯狂,OpenAI究竟是怎么做到的?




本来大家还以为OpenAI已经落后谷歌了,看来并没有!


看起来,OpenAI内部还捂着不少厉害的东西没发布。


而且,领略过GPT-5.2超强满血版的用户,对它是一致好评。


沃顿商学院教授Ethan Mollick表示,自己有幸提前使用了GPT-5.2,它的性能还是令人印象很深刻的。


比如下面这个任务:创建一个视觉上有趣的着色器,可以在twigl-dot-app中运行,使其看起来像一座无限的新哥特式塔楼城市,部分淹没在波涛汹涌的海洋中。

对于这个视频,很多网友大加赞叹:GPT-5.2不仅遵循了指令,还在代码中选择了非常合理的审美和结构。



然后,教授又让GPT-5.2绘制一张人类历年考试成绩的图表。


这个任务十分复杂,因为需要在过程中查找和交叉引用大量资料,然后一次性就生成有用的结果。

可以看到,GPT-5.2的表现十分惊艳。


这个Twigl代码的实例,显出了GPT-5.2的强大编码能力。


推理、数学、编程的重大飞跃

Magicpathai的CEO表示,自己已经测试GPT-5.2有一段时间了。

他对于这个模型的评价是——「复杂推理、数学、编程和模拟方面的一次重大飞跃」。


在下面这个实例中,它在单个文件中就构建了一个完整的3D图形引擎,还支持交互式控制,分辨率达到4K。

在这个视频中,他还用GPT-5.2进行了高难度推理。

有人质疑道:这个图形引擎会不会是GPT-5.2调库完成的?CEO表示,所有代码和图形完全是从0开始写的。


也就是说,GPT-5.2的进步不是渐进式的,而是编码助手功能的彻底范式转变。


网友们惊呼:这种进步的速度,实在是令人头晕目眩。


这位CEO对于GPT-5.2的评价是:它是OpenAI推出的最佳智能体模型,可以连续运行大量工具而不会出现问题,并且比其前代产品速度更快。

为了测试它的功能,他构建了一个智能体,可以同时使用GPT-5.2、5.1和5。

结果显示,GPT-5.2调用工具时无需任何前导码,而且即使在长时间会话中,也不会迷失方向。


还有人让GPT-5.2用ASCII写出了自己的内心世界,答案很震撼。


总之,在大多数人的反馈中,GPT-5.2能稳定地处理实际工作,条理清晰,工作流程顺畅。


相比于会出现小中断的旧模型,GPT-5.2对于任务的理解更强,完成得也更顺利。


ARC Prize表示,GPT-5.2 Pro(X-High)的最新SOTA得分为90.5%,这就意味着,AI在一年内效率已经提高了约390倍。



背后神秘华人,浮出水面

同以往一样,这次GPT-5.2的幕后功臣,依然有不少华人。

比如,最早预告GPT-5.2的OpenAI华人研究员、北大校友Yu Bai。


他本科在北大学习数学,在斯坦福获得统计学博士学位。


负责后训练的Yun Dai,本科来自清华大学,在加州大学尔湾分校获得了计算机科学硕士学位。


另一位OpenAI华人研究员Zuxin Liu,从事推理模型后训练工作。

他本科毕业于北航,在CMU攻读硕士和博士学位。


Aston Zhang来自在伊利诺伊大学厄巴纳-香槟分校攻读博士学位,现在是OpenAI的研究员。


他感谢了团队,尤其强调了GPT-5.2 Thinking的处理多步骤任务能力。


总之,昨晚的AI大战,OpenAI给出了强烈一击。

接下来,谷歌又会拿出什么来应对呢?

参考资料:

https://x.com/skirano/status/1999182295685644366

https://x.com/emollick/status/1999185085719887978

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

来源:https://www.163.com/dy/article/KGJ3FK2K0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

门外汉借ChatGPT破解60年数学难题陶哲轩坦言研究走入误区
AI
门外汉借ChatGPT破解60年数学难题陶哲轩坦言研究走入误区

困扰数学界长达60年的一个“世纪猜想”,竟然被一位门外汉给攻克了。 这位年轻人只有23岁,从未接受过任何高等数学训练。他仅仅凭借一段提示词,就让ChatGPT在80分钟内破解了这道难题。菲尔兹奖得主陶哲轩在审阅后坦言:过去六十年里,所有研究者在第一步就集体走偏了。 23岁门外汉,让全网破防 故事的主

热心网友
05.18
谷超豪院士百年诞辰纪念讲座在上海科技馆举行
科技数码
谷超豪院士百年诞辰纪念讲座在上海科技馆举行

2025年5月15日,是著名数学家、中国科学院院士、国家最高科学技术奖得主谷超豪先生诞辰一百周年的纪念日。为缅怀这位科学巨匠的毕生贡献,弘扬其追求真理的科研精神,并向公众展现基础数学研究的独特魅力,一场主题科普活动于5月10日在上海科技馆报告厅成功举办。这就是第240期上海科普大讲坛特别策划的“遇见

热心网友
05.17
谷超豪院士数学人生与科技强国之路李大潜沈维孝直播讲述
科技数码
谷超豪院士数学人生与科技强国之路李大潜沈维孝直播讲述

为纪念谷超豪先生百年诞辰,5月10日将在上海科技馆举办专题科普讲座。李大潜院士将回顾谷超豪从数学少年成长为学科开拓者的历程,展现其科学精神传承。沈维孝院士则以多项式求根为例,引领听众领略数学的深邃与精巧。这是一次与顶尖学者对话、感受数学魅力的难得机会。

热心网友
05.10
伊利诺伊大学香槟分校破解AI训练难题:五大技巧让机器学习更稳定
科技数码
伊利诺伊大学香槟分校破解AI训练难题:五大技巧让机器学习更稳定

当我们开车在高速公路上行驶时,最怕遇到的就是车子突然失控,方向盘变得异常敏感,稍微一动就可能冲出车道。这种情况在人工智能的训练过程中也经常发生,特别是在训练那些能够进行推理和对话的大型语言模型时。来

热心网友
03.31
威斯康星大学新突破:揭秘AI机器人精准模仿人类的秘密
科技数码
威斯康星大学新突破:揭秘AI机器人精准模仿人类的秘密

这项由威斯康星大学麦迪逊分校研究团队完成的突破性研究,发表于2026年3月的《机器学习》期刊,论文编号为arXiv:2603 20538v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究

热心网友
03.31

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

算力时代电力价值重估 能源如何支撑数字经济
AI
算力时代电力价值重估 能源如何支撑数字经济

近日,国家能源局联合发改委、工信部、国家数据局正式印发《关于促进人工智能与能源双向赋能的行动方案》。这份重磅文件的核心思路非常清晰:一方面,以坚实的能源基础支撑人工智能(AI)的快速发展;另一方面,利用AI技术赋能能源行业转型升级。其核心目标是推动能源、算力、应用场景、数据与算法模型五大关键要素深度

热心网友
05.20
智谱清影与Runway Gen3视频生成模型对比评测
AI
智谱清影与Runway Gen3视频生成模型对比评测

在挑选文生视频工具时,若您正在智谱清影与Runway Gen-3之间权衡,那么了解两者在生成效果上的具体差异,将有助于您做出更明智的选择。本文将从画质清晰度、细节纹理、运动自然度与视频连贯性等核心维度,通过实测对比为您详细解析。 一、画质与分辨率表现 首先对比硬性指标。智谱清影基于CogVideoX

热心网友
05.20
通义万象制作数据可视化科技背景的实用教程
AI
通义万象制作数据可视化科技背景的实用教程

想用通义万相生成一张科技感十足的数据可视化背景,但出来的画面总觉得少了点“内味儿”?数字界面、粒子流、电路纹理这些关键元素一个不见,画面平平无奇?这通常不是工具的问题,而是提示词没有精准锚定科技可视化的核心要素,或者模型参数没调到最佳状态。别急,下面这几种方法,能帮你把想法精准地“翻译”成画面。 一

热心网友
05.20
Vidu视频慢动作与快进效果制作教程
AI
Vidu视频慢动作与快进效果制作教程

想要在Vidu生成的视频中实现流畅的慢动作或快进效果?虽然模型界面没有提供直接调整播放速度的滑块,但通过巧妙的提示词设计、利用内置功能,或结合后期处理工具,你完全可以精准掌控视频的节奏与时间感。本文将为你详细解析四种实用方法,从生成前到生成后,全方位满足你的创作需求。 一、通过精准提示词引导运动节奏

热心网友
05.20
海螺AI学术论文查重降重功能实测与效果分析
AI
海螺AI学术论文查重降重功能实测与效果分析

当您使用海螺AI生成的英文论文在提交查重时遭遇高重复率或AIGC检测异常,请不要急于归咎于工具本身。核心原因在于,尽管AI生成的文本格式标准、语法地道,但其语言模式和常见短语组合,并未针对知网、维普、万方等中文查重数据库的语义比对逻辑进行专门优化。换言之,机器认为流畅自然的表达,在查重系统的算法看来

热心网友
05.20