首页 游戏 软件 资讯 排行榜 专题
首页
AI教程
谷歌Phenaki文字转视频AI模型功能详解与应用

谷歌Phenaki文字转视频AI模型功能详解与应用

热心网友
90
转载
2026-05-22

上个月,Google在文本生成视频领域发布了两个重要模型:Imagen与Phenaki。两者各具特色,Imagen侧重于对语言的深度理解,能够生成画质接近真实照片的短视频;而Phenaki则更专注于长叙事,能够依据一系列文字提示,合成数分钟长、包含多场景转换的连贯影片。简单来说,一个强在“单帧画质”,一个优在“长篇叙事”。

目前,Imagen已通过Google的“AI Test Kitchen”应用,面向美国、英国、加拿大、澳大利亚、新西兰及肯尼亚的英语用户开放体验。AI Test Kitchen是Google于今年8月推出的实验性平台,旨在公开测试其前沿人工智能技术,首批入驻的模型就包括对话系统LaMDA。

那么,能够生成长视频的Phenaki模型,究竟有哪些技术突破?从研究角度看,文本生成视频一直面临几大挑战:计算成本高昂、高质量的文本-视频配对数据稀缺,以及视频时长不固定带来的建模困难。

为应对这些难题,研究团队引入了一种基于因果模型的全新视频表示学习方法。其核心思想是将视频压缩为一组离散的、紧凑的表征标记。关键在于,所采用的分词器配备了因果注意力机制,从而能够灵活适应可变长度的视频输入。

具体流程分为两步:首先,通过一个以预计算文本标记为条件的双向掩码变换器,生成对应的视频标记序列;随后,将这些视频标记进行解码重建,最终输出可视的视频内容。这个过程可以类比为一个高度智能的“视频压缩与解压缩”系统,其编码规则完全通过海量数据学习获得。

更值得关注的是团队应对数据短缺的策略。他们采用了联合训练方法,同步利用海量的图像-文本对数据以及相对较少的视频-文本样本。这种设计使得模型能够实现知识迁移,其生成能力甚至可以泛化至训练数据未覆盖的内容领域,有效缓解了高质量视频数据不足的瓶颈。

与以往技术相比,Phenaki的显著进步在于,它首次实现了在开放领域内,根据一系列随时间推进的文本提示(可视为情节要点或故事大纲)生成任意长度的视频。这不仅意味着生成长视频,更意味着生成逻辑连贯、场景流转的叙事性影片。据了解,这是首篇专门研究基于时序提示生成视频的学术论文。

从实验结果看,Phenaki所提出的视频编码器-解码器架构,在时空质量(即画面在时间与空间维度上的连贯性与清晰度)以及生成效率(单位视频所需的标记数)上,均优于现有基于逐帧生成的基线模型。这表明它在保证输出质量的同时,可能具备更高的计算效能。

Phenaki-Phenaki是Google上個月公布的兩個文字轉影片的AI模型

总而言之,Phenaki将AI视频生成从“制作短视频片段”推进到了“执导动态故事片”的新阶段。它的出现,为AI在未来影视预演、动态内容创作、个性化叙事生成等领域的应用开辟了更广阔的空间。当然,该技术目前仍处于研究阶段,走向实际应用尚需时日,但它无疑为我们指明了一个充满潜力的发展方向。

来源:https://openi.cn/sites/835.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌Phenaki文字转视频AI模型功能详解与应用
AI教程
谷歌Phenaki文字转视频AI模型功能详解与应用

上个月,Google在文本生成视频领域发布了两个重要模型:Imagen与Phenaki。两者各具特色,Imagen侧重于对语言的深度理解,能够生成画质接近真实照片的短视频;而Phenaki则更专注于长叙事,能够依据一系列文字提示,合成数分钟长、包含多场景转换的连贯影片。简单来说,一个强在“单帧画质”

热心网友
05.22
Phenaki文本生成视频模型原理与应用详解
AI教程
Phenaki文本生成视频模型原理与应用详解

在AI视频生成技术快速发展的今天,Phenaki模型凭借其出色的文本到视频生成能力,已成为行业瞩目的焦点。它能够根据用户输入的文字描述,智能生成随时间动态演变、情节连贯的长视频,甚至可构建长达数分钟的故事叙事,为视觉内容创作与数字媒体生产开辟了全新的可能性。 Phenaki的核心能力与优势 Phen

热心网友
05.21

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

欧易OKX交易所注册下载与身份认证全流程指南
web3.0
欧易OKX交易所注册下载与身份认证全流程指南

欧易OKX交易所注册需通过官方渠道下载APP,完成手机号或邮箱注册并设置密码。身份认证要求用户提交身份证件照片及人脸识别信息,以符合安全合规要求。整个过程旨在保障账户安全与交易合法性。

热心网友
05.23
币安官网注册教程:安全获取官方链接与账户创建指南
web3.0
币安官网注册教程:安全获取官方链接与账户创建指南

币安官方App下载与安装全指南 对于希望随时随地进入加密市场的朋友来说,一个安全可靠的交易平台App是必不可少的工具。币安,作为全球领先的加密货币交易平台,其官方应用程序集成了现货、合约等多种交易功能,是管理数字资产的得力助手。今天,我们就来详细拆解一下如何获取并安装这款官方App,确保您每一步都安

热心网友
05.23
2025年币安官网最新入口地址及安全访问指南
web3.0
2025年币安官网最新入口地址及安全访问指南

欢迎来到币安:2025年官方入口与安全使用全指南 在加密货币世界,选择一个可靠、功能全面的交易平台是第一步。币安,作为全球领先的数字资产交易平台,以其丰富的资产选择、强大的交易引擎和持续优化的用户体验,成为了众多投资者的首选。今天这份指南,将为你清晰呈现2025年币安官方网站的最新入口,并手把手带你

热心网友
05.23
币安App最新版v3.4.1官方下载指南与安全安装教程
web3.0
币安App最新版v3.4.1官方下载指南与安全安装教程

币安(Binance)移动应用:官方下载与使用全指南 在数字资产交易领域,币安(Binance)无疑是全球领先的平台之一。其推出的移动应用,将丰富的交易与管理功能浓缩于方寸屏幕之间,让用户能够随时随地掌控自己的资产。接下来,这份指南将为您详细解析如何安全、顺利地完成官方应用的下载、安装与基础设置,文

热心网友
05.23
币圈入门指南:详解区块链行业与打新玩法全攻略
web3.0
币圈入门指南:详解区块链行业与打新玩法全攻略

Web3与加密货币世界深度解析:从入门到精通 随着区块链技术的不断成熟与普及,一个被称为“Web3”的全新数字时代正在加速到来。这个以去中心化为核心理念的生态系统,正深刻改变着我们对价值、所有权和信任的认知。对于广大投资者和科技爱好者而言,理解这个常被称为“币圈”的领域,不仅是把握前沿趋势的关键,更

热心网友
05.23