谷歌Gemini Omni全能模型上线一句话指令即可修改视频

时间：2026-05-20 09:22

谷歌发布全能多模态AI模型GeminiOmni，可实现跨文字、图像、视频和音频的流畅理解与生成。用户能以自然语言指令直接编辑视频内容。同时推出的科研专用版能追踪论文、生成代码与科学假设。模型已部分集成至谷歌产品，未来将开放API，推动多模态能力融入更广泛应用。

2026年谷歌I/O开发者大会于5月20日揭幕，正式发布了具有里程碑意义的多模态AI模型——Gemini Omni。这款模型被广泛认为将重塑人工智能领域的竞争格局。

在发布会现场，Google DeepMind负责人、诺贝尔奖得主德米斯·哈萨比斯（Demis Hassabis）亲自登台，将Gemini Omni定义为Gemini系列中“功能最全面、能力最强大的版本”。“Omni”一词意为“全能”，其命名精准地反映了模型的核心特性。从现场展示的多项功能来看，无论是处理文本、图像、视频还是音频数据，Gemini Omni都展现出了前所未有的跨模态理解深度与生成流畅度，标志着多模态AI技术迈上了新台阶。

该模型的核心突破可概括为“支持任意模态输入，生成任意模态输出”。这为用户带来了革命性的交互体验。例如，用户仅需通过自然语言指令，如“将视频主角替换为熊猫，并将背景调整为雪山场景”，即可实现对视频内容的智能编辑与重构。这种直观的“对话式创作”能力，极大地降低了专业内容制作的门槛，让创意实现变得前所未有的简单。

除了面向广泛用户的通用版本，谷歌此次还重点推出了专为科研工作者设计的“Gemini for Science”。这一科研专用模型超越了传统的文献检索工具，具备三大核心能力：实时追踪全球最新学术论文动态；将研究人员提出的抽象研究思路自动转化为可执行代码；甚至能够基于现有实验数据，主动推理并生成新的科学假设。这相当于为每一位科学家配备了一位24小时在线的AI科研助手，有望从多个环节显著加速科学发现与技术创新进程。

在模型落地方面，谷歌同步发布了Gemini Omni家族的首个具体模型——Gemini Omni Flash，并宣布即日起在Gemini App、Google Flow及YouTube Shorts等核心产品中集成应用。对于广大开发者和企业用户而言，更具吸引力的消息是：谷歌承诺即将开放Gemini Omni的API接口服务。这意味着其强大的多模态AI能力将能够被便捷地集成到各类第三方应用程序、网站及企业解决方案中，开启AI应用生态的无限可能。

从实现全模态无缝交互，到深度赋能垂直科研领域，谷歌通过此次发布不仅树立了行业技术新标杆，更清晰地展现了其AI生态向纵深发展与广泛赋能的战略路线图。多模态人工智能的竞争，已正式进入以“全模态自然融合”为核心特征的新时代。

来源：https://www.donews.com/news/detail/1/6563026.html

Gemini

上一篇谷歌Gemini 3.5 Flash模型发布速度提升4倍性能超越GPT-4 下一篇中创新航确认为小米汽车电池供应商

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-01

诺基亚TA-1619入网：1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息，一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可，不过证件照目前还没公布。从入网信息来看，这是一款TD-LTE数字移动电话机，支持TD-LTE网络，属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持，终端款式为直板。核心配置方面，电池额定容

业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片，采用直接变频架构，覆盖10MHz至7250MHz频段，支持最大450MHz带宽及JESD204B高速接口，性能对标国际，满足5G基站与卫星通信等高端需求，突破海外技术壁垒。

业界动态 · 2026-07-01

月起私人充电桩可卖电每度净赚5毛

近期有一则重大利好消息，值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起，湖北武汉的新能源车主，可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言，就是借助峰谷电价差，实现低买高卖，每度电净收益约5毛钱。过去，车网互动（V2G）基本只局限于特定的公共充电站，受试点规模限制，

业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息：谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息，Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发，实际上它的技术代号是Gemini 3 1 Flash Lite Image，属于Gemini 3 1家族。最大的卖点就两个：快，便

业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行，来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴，以主板、显示器等专业硬件保障比赛稳定流畅，并通过赛事反哺研发的闭环模式支持电竞发展。