科技媒体 The Decoder 于 9 月 24 日报道指出,谷歌对其 Gemini 1.5 AI 模型进行了重大升级,最新推出的两个版本——Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002——在成本、性能与响应速度方面均带来了实质性的提升。简而言之,就是更具性价比、响应更迅速、能力更强劲。
成本更低
价格始终是开发者最关注的核心痛点,此次谷歌直接采取了大幅让利策略。Gemini-1.5-Pro-002 与 Gemini-1.5-Flash-002 的 token 输入与输出费用最高降幅可达 50%。与此同时,两款模型的速率限制得到了提高,延迟反而有所降低——典型的“增量不增价”。新定价将从 2024 年 10 月 1 日起正式施行。对于正在评估接入大模型 API 的团队而言,这无疑是一个值得重点关注的时间节点。

性能更强
单纯降价显然不够,性能才是硬实力。根据谷歌官方新闻稿披露的数据,这批新模型在多项基准测试中均取得了显著进步:
- 在更具挑战性的 MMLU-Pro 基准测试中,性能提升了约 7%。
- 数学能力提升尤为突出——在 MATH 与 HiddenMath 测试中,成绩提高了 20%。
- 视觉理解与 Python 代码生成方面也实现了 2-7% 的优化。
值得一提的是,谷歌表示这些模型在保持内容安全标准的同时,生成的回复更加“实用”。开发者的反馈也未被忽视——模型输出风格经过了针对性调整,目标是让每一次调用都更加精准且经济。归根结底,这才是真正意义上的“迭代升级”。
其它改进
除两款主力模型外,谷歌还将 8 月发布的 Gemini 1.5 实验模型进行了升级,推出了 Gemini-1.5-Flash-8B-Exp-0924 版本,进一步强化了文本及多模态应用的能力。至于如何上手?新模型可通过 Google AI Studio、Gemini API 以及面向 Google Cloud 客户的 Vertex AI 进行访问。此外,针对 Gemini Advanced 用户,谷歌还准备了 1.5 Pro-002 的聊天优化版,不过目前尚无具体上线时间表。
总体来看,这次升级明确聚焦于“更好用、更实惠”的方向,而 10 月 1 日的新定价或许会成为众多团队切换模型的一个重要契机。
