6月13日,Google Research正式推出了Gemini-SQL2模型。该新版本基于Gemini 3.1 Pro精心打磨,专攻Text-to-SQL任务——即将自然语言问题自动翻译为SQL查询语句。用户无需再手动编写复杂的数据库语法,只需用口语描述需求,系统即可尝试生成可执行的SQL代码。

事实上,这项技术早已不属新鲜事物,在数据分析、自助报表、企业搜索及SaaS数据问答场景中已被广泛采用。但长期以来的难点依然存在:如何准确理解表结构、消解字段歧义、将复杂的业务规则融入模型——这些问题始终没有轻松答案。
Gemini-SQL2在核心指标上交出了令人瞩目的成绩:在BIRD(Text-to-SQL领域公认的关键评测基准)的单模型赛道上,其执行准确率达到了80.04%,超越了谷歌此前自家的Gemini-SQL模型。BIRD基准覆盖95个数据库、37个专业领域,包含12751组问题与SQL配对,数据总量高达33.4GB。尤为重要的是,该基准刻意引入了脏数据与外部知识需求,因此比早期基准更贴近真实企业环境,评测难度自然更高。
在实际业务场景中,这一能力意味着什么?业务人员可直接通过自然语言查询营收、流失率、区域表现等核心指标,自助式分析的门槛被大幅降低。不过,现阶段谷歌尚未公开Gemini-SQL2的模型标识、API接口、模型卡或技术报告,也未确认哪些产品将率先接入——这些细节有待后续更新。
