北京时间12月12日:为了应对谷歌Gemini 3的激烈竞争,OpenAI迅速推出了新一代模型GPT-5.2。我们获得了AI公司OthersideAI首席执行官Matt Shumer对GPT-5.2进行的深度评测,他已提前获得内测权限两周,核心评测要点分享如下:

- 指令遵循与任务意图:GPT-5.2的“思考”模式在理解和坚决完成复杂指令方面,确实向前迈进了一步。
- 代码生成能力显著提升:相比GPT-5.1进步明显。它能力更强、更独立、思考也更周密,并且更乐于编写大量代码。
- 视觉与长上下文理解:这方面有了大幅改进,尤其是在理解图像中的空间关系和处理大型代码库方面表现出色。
- 速度是主要短板:在作者的体验中,尽管其他测试者反馈不一,但“思考”模式在处理大多数问题时确实相当缓慢。他几乎从不使用“即时”模式。
- GPT-5.2 Pro:其深度推理能力强大到令人惊讶,但速度很慢,偶尔还会陷入长时间思考后依然无法解决问题的困境。
- Codex CLI:GPT-5.2是作者在命令行工具中使用过的、最接近专业级编码能力的模型,但实现这种能力的高级推理模式有时需要漫长的等待。
