谷歌Gemini Omni多模态大模型发布支持任意输入输出

时间：2026-05-20 11:47

谷歌发布旗舰多模态大模型GeminiOmni，旨在实现“任意输入、任意输出”。该模型整合多项技术，能统一处理文本、图像、音频、视频等多种信息，理解其逻辑并生成符合现实规则的结果。其突出的“对话式实时编辑”功能允许用户通过自然语言指令精准调整生成内容，显著提升了创作效率与修改便捷性。

5月20日凌晨，谷歌I/O开发者大会正式揭晓了其革命性的多模态人工智能模型——Gemini Omni。这款旗舰模型的核心使命，是实现“任意模态输入、任意模态输出”的终极愿景。

Gemini Omni旨在彻底消除文本、图像、音频、视频等不同数据形式之间的隔阂，构建一个能够统一理解与生成全模态内容的智能框架。这标志着AI从处理单一信息类型，向综合感知与创造迈出了关键一步。

为实现这一目标，谷歌深度融合了三大前沿技术支柱：擅长模拟物理规律的世界模型Genie、高效轻量的图像模型Nano Banana，以及强大的视频生成模型Veo。它们共同构成了Gemini Omni处理复杂多模态任务的坚实技术底座。

那么，Gemini Omni究竟能完成哪些具体任务？您可以想象这样一个场景：将手绘草图、一段文字描述、几张参考图片，甚至是一段语音或视频片段，同时输入给模型。它不仅能精准识别每一种信息，更能深度理解它们之间的内在逻辑联系，并依据现实世界的物理规则，最终生成一个高度协调、符合常理的结果。这个结果可能是一段动态视频、一张合成图像，或是一份逻辑缜密的文本分析报告。

本次发布最令人瞩目的实用化突破，在于其创新的“对话式实时编辑”功能。该功能直指传统AI内容生成工具的核心痛点——生成结果一旦定型，任何细微修改都可能需要推倒重来，过程极其繁琐。

Gemini Omni彻底改变了这一工作流。在内容生成后，用户可以直接通过自然语言对话，对细节进行精准、连续的迭代优化。例如，您可以轻松指令“将视频中的天空背景替换为黄昏色调”、“把主角外套的材质调整为皮革”，或是“加快爆炸特效的扩散速度”。更重要的是，这些局部修改不会破坏画面整体的逻辑连贯性与物理真实性，使得创意调整变得前所未有的流畅与高效。

发布会现场的演示极具冲击力：演示者仅用寥寥数笔手绘图形，结合简单的文字指令，系统便实时生成了一段包含复杂物体碰撞与物理特效的短视频。这生动展现了Gemini Omni在大幅降低专业内容创作门槛、激发创意潜能并提升生产效率方面的巨大潜力，为未来的人机协作模式开启了全新可能。

来源：https://www.techweb.com.cn/internet/2026-05-20/2975677.shtml

谷歌

上一篇小米米家洗衣机 Pro 波轮新品上市 899元起 99.99%抗菌 100%除螨 下一篇SpaceX计划收购Cursor AI编程公司若IPO失败需支付百亿美元分手费

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5

科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起，两项关乎电动汽车安全的核心强制性国家标准将正式实施，为行业加装“安全锁”——《电动汽车安全要求》（GB 18384-2025）与《电动汽车用动力蓄电池安全要求》（GB 38031-2025）同步落地。此次标准升级，从整车架构与电池系统两大维度，精准填补了近年来多起事故暴露出的