谷歌Gemini 3.1 Flash-Lite发布:更快更省,性能超越Flash 2.5
3月4日,谷歌正式发布Gemini 3.1 Flash-Lite,宣称这是Gemini 3系列中速度最快、性价比最高的模型。该公司表示,3.1 Flash-Lite专为开发者的大规模、高吞吐量工作负载而设计,在其价格区间和模型级别中展现出极高的质量。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
即日起,3.1 Flash-Lite将通过Google AI Studio中的Gemini接口向开发者开放预览版,并通过Vertex AI面向企业用户推出。
3.1 Flash-Lite每百万输入Token收费0.25美元,每百万输出Token为1.50美元。根据Artificial Analysis的基准测试,3.1 Flash-Lite在保持同等或更高质量的前提下,性能表现优于2.5 Flash。其首字响应速度提升了2.5倍,输出速度也增长了45%。谷歌称,这种低延迟特性是高频工作流的必备条件,使其成为开发者构建响应式实时体验的理想模型。

3.1 Flash-Lite在Arena.ai排行榜上获得了1432分。在推理和多模态理解的各项基准测试中,它的表现均超越了同级别的其他模型。例如,它在GPQA Diamond测试中取得了86.9%的成绩,在MMMU Pro测试中获得了76.8%的成绩。这一表现甚至超越了前几代体积更大的模型,如2.5 Flash。

除了原生性能外,Gemini 3.1 Flash-Lite在AI Studio和Vertex AI中还标配了“思考等级”功能。这让开发者能够灵活控制模型针对特定任务的“思考”深度,对于管理高频工作负载而言,这一功能至关重要。3.1 Flash-Lite能够处理大规模任务,例如对成本敏感的大批量翻译和内容审核。同时,它也能胜任需要深度推理的复杂工作,例如生成用户界面和仪表板、创建模拟环境以及遵循复杂指令。
谷歌表示,AI Studio和Vertex AI的早期接入开发者,以及拉提图德、卡特维尔和威灵等公司,已经开始使用3.1 Flash-Lite来解决大规模的复杂问题。早期测试人员强调了3.1 Flash-Lite的效率和推理能力。他们表示,该模型能够以大体量模型的精度处理复杂输入,并能严格遵循指令,保持高度的一致性。
相关攻略
IT之家 3 月 28 日消息,消息源 @stufflistings 昨日(3 月 27 日)在 X 平台发布推文,分享了一加 Nord CE6 真机照片,该手机有望于今年 5 月发布。发布日期方面
3月4日消息,谷歌今日正式推出Gemini 3 1 Flash-Lite,声称这是Gemini 3系列中速度最快、性价比最高的模型,并表示3 1 Flash-Lite专为开发者的大规模、高吞吐量工作
美东时间3月3日周二,谷歌推出Gemini 3系列中速度最快、性价比最高的模型——Gemini 3 1 Flash-Lite。它专为开发者大规模高频工作负载设计,以更低价格实现不妥协的智能表现。Ge
IT之家 2 月 28 日消息,小米安全中心今天更新终止维护机型(EOL)名单,其中 11 全系、12 天玑版以及平板 5 全系等机型在列。IT之家附更新机型列表如下:小米:Mi 11 (cn)Mi
新智元报道编辑:KingHZ Aeneas【新智元导读】最近,炸裂消息一个接一个。首先,DeepSeek V4将在一周内上线。第二,它跳过英伟达,把访问权限首先给了某国内芯片厂商。另外,Anthro
热门专题
热门推荐
3月28日消息,中国联通近日发布2025年度业绩报告,在网络建设领域交出亮眼答卷。中国联通表示,公司持续落实信号升格、宽带升级相关举措,目前近九成宽带已具备千兆接入能力,万兆光网更在全国100多个城
163邮箱个人版登录入口为https: mail 163 com,支持网页及手机浏览器直接访问,提供手机号、邮箱账号、扫码三种登录方式,界面简洁,功能齐全,适配多终端使用。163
在冒泡社区中,设置键盘能为用户带来更便捷、舒适的操作体验。以下是详细的设置方法。首先,打开冒泡社区应用程序。进入社区主界面后,找到屏幕上的设置选项。这通常可以在界面的某个角落,以一
一场谎言的终幕是崩坏星穹铁道中4 1版本的新光锥之一,其属性可以提高装备的暴击率,下面小编就为大家带来《崩坏:星穹铁道》一场谎言的终幕光锥效果一览,不清楚的一起来看看吧。《崩坏:星
2026年3月28日中午12时整,由腾讯视频全网独播的古装奇幻剧《白日提灯》准时上线。该剧开播前预约人数高达674万人次,被平台力推为“年度古偶扛鼎之作”,然而仅播出六小时后,口碑便急速崩塌,引发全





