游乐游手机版
首页/业界动态/文章详情

谷歌Gemini Omni全能模型上线一句话指令即可修改视频

时间:2026-05-20 09:22
谷歌发布全能多模态AI模型GeminiOmni,可实现跨文字、图像、视频和音频的流畅理解与生成。用户能以自然语言指令直接编辑视频内容。同时推出的科研专用版能追踪论文、生成代码与科学假设。模型已部分集成至谷歌产品,未来将开放API,推动多模态能力融入更广泛应用。

2026年谷歌I/O开发者大会于5月20日揭幕,正式发布了具有里程碑意义的多模态AI模型——Gemini Omni。这款模型被广泛认为将重塑人工智能领域的竞争格局。

在发布会现场,Google DeepMind负责人、诺贝尔奖得主德米斯·哈萨比斯(Demis Hassabis)亲自登台,将Gemini Omni定义为Gemini系列中“功能最全面、能力最强大的版本”。“Omni”一词意为“全能”,其命名精准地反映了模型的核心特性。从现场展示的多项功能来看,无论是处理文本、图像、视频还是音频数据,Gemini Omni都展现出了前所未有的跨模态理解深度与生成流畅度,标志着多模态AI技术迈上了新台阶。

该模型的核心突破可概括为“支持任意模态输入,生成任意模态输出”。这为用户带来了革命性的交互体验。例如,用户仅需通过自然语言指令,如“将视频主角替换为熊猫,并将背景调整为雪山场景”,即可实现对视频内容的智能编辑与重构。这种直观的“对话式创作”能力,极大地降低了专业内容制作的门槛,让创意实现变得前所未有的简单。

除了面向广泛用户的通用版本,谷歌此次还重点推出了专为科研工作者设计的“Gemini for Science”。这一科研专用模型超越了传统的文献检索工具,具备三大核心能力:实时追踪全球最新学术论文动态;将研究人员提出的抽象研究思路自动转化为可执行代码;甚至能够基于现有实验数据,主动推理并生成新的科学假设。这相当于为每一位科学家配备了一位24小时在线的AI科研助手,有望从多个环节显著加速科学发现与技术创新进程。

在模型落地方面,谷歌同步发布了Gemini Omni家族的首个具体模型——Gemini Omni Flash,并宣布即日起在Gemini App、Google Flow及YouTube Shorts等核心产品中集成应用。对于广大开发者和企业用户而言,更具吸引力的消息是:谷歌承诺即将开放Gemini Omni的API接口服务。这意味着其强大的多模态AI能力将能够被便捷地集成到各类第三方应用程序、网站及企业解决方案中,开启AI应用生态的无限可能。

从实现全模态无缝交互,到深度赋能垂直科研领域,谷歌通过此次发布不仅树立了行业技术新标杆,更清晰地展现了其AI生态向纵深发展与广泛赋能的战略路线图。多模态人工智能的竞争,已正式进入以“全模态自然融合”为核心特征的新时代。

来源:https://www.donews.com/news/detail/1/6563026.html
上一篇谷歌Gemini 3.5 Flash模型发布 速度提升4倍性能超越GPT-4 下一篇中创新航确认为小米汽车电池供应商
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
诺基亚TA-1619入网:1400mAh电池双卡双待新机
业界动态 · 2026-07-01

诺基亚TA-1619入网:1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息,一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可,不过证件照目前还没公布。 从入网信息来看,这是一款TD-LTE数字移动电话机,支持TD-LTE网络,属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持,终端款式为直板。核心配置方面,电池额定容

芯佰微CBMRF900系列国产射频芯片突破海外壁垒
业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片,采用直接变频架构,覆盖10MHz至7250MHz频段,支持最大450MHz带宽及JESD204B高速接口,性能对标国际,满足5G基站与卫星通信等高端需求,突破海外技术壁垒。

月起私人充电桩可卖电 每度净赚5毛
业界动态 · 2026-07-01

月起私人充电桩可卖电 每度净赚5毛

近期有一则重大利好消息,值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起,湖北武汉的新能源车主,可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言,就是借助峰谷电价差,实现低买高卖,每度电净收益约5毛钱。过去,车网互动(V2G)基本只局限于特定的公共充电站,受试点规模限制,

谷歌发布Nano Banana 2 Lite 4秒出图1元4张
业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3 1 Flash Lite Image,属于Gemini 3 1家族。最大的卖点就两个:快,便

技嘉专业电竞装备助力2025 CFS世界总决赛
业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行,来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴,以主板、显示器等专业硬件保障比赛稳定流畅,并通过赛事反哺研发的闭环模式支持电竞发展。