谷歌Gemini Omni全能模型上线一句话指令即可修改视频
2026年谷歌I/O开发者大会于5月20日揭幕,正式发布了具有里程碑意义的多模态AI模型——Gemini Omni。这款模型被广泛认为将重塑人工智能领域的竞争格局。

在发布会现场,Google DeepMind负责人、诺贝尔奖得主德米斯·哈萨比斯(Demis Hassabis)亲自登台,将Gemini Omni定义为Gemini系列中“功能最全面、能力最强大的版本”。“Omni”一词意为“全能”,其命名精准地反映了模型的核心特性。从现场展示的多项功能来看,无论是处理文本、图像、视频还是音频数据,Gemini Omni都展现出了前所未有的跨模态理解深度与生成流畅度,标志着多模态AI技术迈上了新台阶。
该模型的核心突破可概括为“支持任意模态输入,生成任意模态输出”。这为用户带来了革命性的交互体验。例如,用户仅需通过自然语言指令,如“将视频主角替换为熊猫,并将背景调整为雪山场景”,即可实现对视频内容的智能编辑与重构。这种直观的“对话式创作”能力,极大地降低了专业内容制作的门槛,让创意实现变得前所未有的简单。
除了面向广泛用户的通用版本,谷歌此次还重点推出了专为科研工作者设计的“Gemini for Science”。这一科研专用模型超越了传统的文献检索工具,具备三大核心能力:实时追踪全球最新学术论文动态;将研究人员提出的抽象研究思路自动转化为可执行代码;甚至能够基于现有实验数据,主动推理并生成新的科学假设。这相当于为每一位科学家配备了一位24小时在线的AI科研助手,有望从多个环节显著加速科学发现与技术创新进程。
在模型落地方面,谷歌同步发布了Gemini Omni家族的首个具体模型——Gemini Omni Flash,并宣布即日起在Gemini App、Google Flow及YouTube Shorts等核心产品中集成应用。对于广大开发者和企业用户而言,更具吸引力的消息是:谷歌承诺即将开放Gemini Omni的API接口服务。这意味着其强大的多模态AI能力将能够被便捷地集成到各类第三方应用程序、网站及企业解决方案中,开启AI应用生态的无限可能。
从实现全模态无缝交互,到深度赋能垂直科研领域,谷歌通过此次发布不仅树立了行业技术新标杆,更清晰地展现了其AI生态向纵深发展与广泛赋能的战略路线图。多模态人工智能的竞争,已正式进入以“全模态自然融合”为核心特征的新时代。
相关攻略
今天凌晨的谷歌I O开发者大会,带来了令人振奋的重磅发布。谷歌正式推出了名为Gemini Spark的个人AI智能体,这不仅仅是一个简单的聊天机器人,更是一个能够同时处理多项任务的智能副手,真正实现了“一句话让AI干几份活”的高效体验。 Gemini Spark的核心设计理念是极致的用户导向:一切听
谷歌与三星合作推出两款智能眼镜,整合GeminiAI,支持语音导航与实时翻译。眼镜设计分为时尚与经典两种风格,旨在提供免手持的信息服务,如路线指引、附近推荐与通知整理。产品预计秋季上市,具体售价待公布。
谷歌与三星在I O大会上展示了两款智能眼镜原型,由GentleMonster和WarbyParker分别设计。眼镜整合GeminiAI,作为手机伴侣提供免手持交互,支持语音导航、个性化推荐、订单下达及通知摘要。其实时翻译功能可处理对话与视觉文字,并贴近原声音质。两款设计风格各异,瞄准不同用户。价格未定,传闻约379至499美元,预计秋季上市。
谷歌于5月20日正式发布Gemini3 5Flash模型,定位为当前最快、最高效的模型,旨在满足需要即时响应的现实场景。该轻量级模型致力于帮助用户处理日常事务与多步骤创意项目,应对各种复杂性并快速将想法转化为行动。
谷歌发布Gemini3 5Flash模型,强调其是目前最快、最高效的AI模型,旨在应对现实场景中需要快速响应和多步骤处理的复杂任务。该模型注重轻量化与高性能的平衡,针对实时对话、内容摘要等高频率需求优化,以提升用户体验并控制成本。此举加剧了中端AI市场的竞争,推动AI工具向更高效、更易用的方向发展。
热门专题
热门推荐
陆瑾是《异人之下》手游中操作门槛较高的角色,主打中近距离压制。其核心在于普攻攒炁,并衔接常技【太冲震恚】与【曲泉交忿】进行输出。关键技能【五雷符】可攻可守,成功防御反击可重置冷却。连招依赖“反手”逻辑与精准预判,形成攻防循环。投技【双龙探爪】与【戾走急脉】则需把握时机,分别用于破防与针。
投资策略需要明确目标与风险偏好,合理分配资金。通过研究项目基本面、关注市场周期与情绪,建立多元化组合。执行中需设定清晰的买卖规则,利用工具辅助决策,并保持长期视角与纪律性,避免情绪化操作。定期复盘与调整是策略持续有效的关键。
巴伦是《异人之下》手游中的近战压制型角色,核心玩法在于追击与倒地连招。其技能“破势突击”衔接流畅,“极速连斩”可追击倒地目标,“飞身十字固”抓取伤害高,“逆势突围”用于防守反击。角色操作上限高,需练习掌握连招循环,但对战远程角色时较为吃力。
谷歌宣布Gemini3 5Pro模型下月发布,已在内部广泛使用且进步显著。具体技术细节、性能参数及开放计划尚未公布,更多信息将于下月揭晓。
谷歌在2026年I O大会上推出月费100美元的新AI订阅计划,旨在填补其现有20美元与250美元两档服务之间的市场空白。该计划面向需要更多资源的高级用户和小型团队,提供比基础版更强的性能,同时避免企业级的高昂成本,以竞争中高端市场。





