时间:2025-08-11 作者:游乐小编
千呼万唤始出来,OpenAI终于发布了万众期待的GPT-5。这个消息一出,整个科技圈都沸腾了。
OpenAI的官宣推文不到24小时就突破300万阅读量,3万点赞;我的社交圈也被各种GPT-5的讨论刷屏。看来虽然大家平时总吐槽OpenAI越来越"拉胯",但每次新模型发布还是能引发全民热议。
奥特曼在发布会上把GPT-5吹上了天,称这是他们迄今为止最智能的模型,声称其在各个领域都达到了博士级水平。但网友们的反应却两极分化,有人直言这根本不是GPT-5,甚至不如grok。
更有意思的是,Polymarket上关于"8月底最强AI模型"的竞猜赔率,在发布会后出现了戏剧性反转,谷歌和OpenAI的赔率直接对调了。
最让人哭笑不得的是,发布会上展示的代码准确度对比图,52.8%的柱状图竟然比69.1%还高,这种低级错误让网友直呼"小学生都不会犯"。
不过平心而论,GPT-5在基准测试上的表现确实亮眼,在LMArena大模型竞技场上一举拿下多项第一。但实际体验如何呢?经过深度测试后,我的感受是:与其叫GPT-5,不如叫GPT4.6更贴切。
编程能力确实是GPT-5的一大亮点。在与Gemini 2.5 pro的对比测试中,GPT-5在模拟弹性碰撞时表现更出色,不仅准确标注了速度方向,还能流畅调整球体大小。
而在模拟多米诺骨牌时,GPT-5的表现更是惊艳,骨牌倒下时的物理效果相当逼真。相比之下,Gemini虽然也能完成,但效果就差强人意了。
不过GPT-5也有翻车的时候。让它开发一个简单的飞船游戏,结果飞船的动力和尾焰方向完全对不上,直接上演"出门即坠机"的戏码。
这次更新最显著的变化是效率提升。根据OpenAI官方数据,GPT-5在保持准确率的同时,思考时间更短,输出token数减少了50%-80%。更令人惊喜的是,它的事实错误率比GPT-4o降低了45%,思考时的事实错误率更是降低了80%。
但作为文字工作者,我最关心的还是它的创作能力。测试发现,GPT-5在逻辑推理方面确实进步明显,但文本创作却显得有些保守。让它写段自夸文案,结果出来的内容像首肉麻的情诗。
更让人不解的是,OpenAI在发布GPT-5的同时,竟然悄悄移除了之前的所有模型版本。现在普通用户只能看到GPT-5这一个选项,这种强制升级的做法确实不太厚道。
总的来说,这次OpenAI的更新重点放在了"实用化"上,而非性能的突破性提升。这或许预示着大模型的发展正在从追求性能转向优化体验。不过用户们最期待的,可能还是下一个真正具有颠覆性的AI模型。
那么问题来了:下一个能带来惊喜的会是谁呢?DeepSeek R2还是Gemini 3.0?让我们拭目以待。
2021-11-05 11:52
手游攻略2021-11-19 18:38
手游攻略2021-10-31 23:18
手游攻略2022-06-03 14:46
游戏资讯2025-06-28 12:37
单机攻略