11月19日最新消息,全球AI竞技场在2025年末再度掀起波澜。权威测评机构SuperCLUE刚刚发布的报告显示:谷歌Gemini-3-Pro-Preview在SuperCLUE+九月中文大模型基准测试中获得70.80的总分。
这个成绩比GPT-5(high)高出了1.43分,但略低于GPT-5.1(high)1.71分,最终位列全球第二。而Gemini-2.5-Pro目前排名全球第七。

Gemini-3-Pro-Preview在推理效率上较Gemini-2.5-Pro有所提升,平均每道题的作答时间从32.2秒缩短到了31.9秒。不过其推理成本略有增加,从每百万tokens消耗24.5元上升至32.0元。
据了解,本次测评涵盖了六大核心维度,包括数学推理、科学推理、代码生成(含Web开发)、智能体应用(多轮工具调用)、幻觉控制以及精准指令遵循。
与GPT-5.1(high)相比,Gemini-3-Pro-Preview的优势主要体现在幻觉控制和科学推理方面表现突出,但在其他四个维度上则全面落于下风。

