游乐游手机版
首页/业界动态/文章详情

阿里HappyHorse 1.1视频生成模型告别变脸卡顿

时间:2026-06-23 13:04
阿里发布HappyHorse1 1视频生成模型,围绕动态表现、主体一致性、指令理解、画质和音画同步五大维度升级。支持3-15秒时长、720P 1080P分辨率及任意宽高比,改善动作卡顿与角色变脸,支持9张参考图,原生音画同步适配7种语言,单张H100显卡即可输出1080P成片。

2025年年中之际,阿里巴巴旗下文生视频大模型迎来重磅升级——HappyHorse 1.1版本正式发布。这是自1.0版本亮相以来,规模最大、覆盖最全的一次全方位迭代。新版模型围绕动态表现、主体保真、指令理解、画面质感与音频同步五大核心维度,进行了系统性优化。目前,该版本已在HappyHorse官网、阿里云百炼及千问云平台同步开放调用,全面支持创作者使用。

在基础规格方面,1.1版本延续了前代的灵活特性。单次依然可生成3至15秒的视频片段,原生支持720P与1080P两种高清分辨率,并能兼容任意自定义宽高比。这一设计思路目标明确:覆盖短视频、广告短片、短剧分镜预览等多元化创作场景,满足不同用户的实际需求。

阿里发布HappyHorse 1.1视频生成模型:告别角色变脸、动作卡顿

动态表现力升级:告别动作卡顿与画面失真

动态效果无疑是本次升级的核心亮点。新版模型重构了内部运动及时序建模逻辑,着力改善旧版中偶尔出现的动作迟缓和动态张力不足问题。实际效果显著——在舞蹈、打斗、流体运动、布料摆动等复杂画面中,动作连贯性得到大幅提升。这意味着算法层面有效缓解了业界长期存在的动作失真与画面拖影等“通病”。

主体一致性增强:角色不再“变脸”

另一个常见痛点——“角色变脸”现象,在新版本中得到明显改善。模型现在可同时输入多达9张角色或商品参考图片,强化了对多分镜、多素材的融合理解能力。这意味着在生成过程中,人物的五官特征、品牌Logo以及产品精细细节都能更稳定地保留。对于需要多人物连续镜头或系列化内容的场景,例如直播带货视频、系列广告或连续短剧的批量生产,这无疑是一个重大利好。

阿里发布HappyHorse 1.1视频生成模型:告别角色变脸、动作卡顿

理解与质感:从指令到画质的全面精进

在指令遵循方面,模型能力进一步提升。无论是简短关键词提示,还是包含多场景、多人物关系及复杂镜头调度的长段叙事描述,模型都能精准拆解并执行。这使得复杂分镜的画面排布更加稳定,整体叙事逻辑也更趋完整。

画质方面,本次完成了更精细化的调校。一个直观改进是:大幅削弱了AI生成内容常见的“油光感”、过度锐化以及不真实的磨皮效果。皮肤毛孔、衣物纹理褶皱等真实细节得以完整保留,使生成的人像及实景视频在质感上更贴近实拍效果,已达到商业广告的高清输出标准。

阿里发布HappyHorse 1.1视频生成模型:告别角色变脸、动作卡顿

原生音画同步:告别后期对口型

音频生成部分延续了原生音画同步的架构优势。这与当前主流“先出画面,再后期配音”方案截然不同。HappyHorse采用一体化建模,将文本、画面和音频在同一序列中处理,实现生成过程同步输出匹配口型的原声音频。它支持中、英、日、韩、德、法、阿拉伯共7种语言唇形对齐,基本做到“出片即成品”,无需二次调音对齐音画。

最后看底层技术。模型基于15B参数的单Transformer流式架构,并搭配蒸馏去噪优化。这套组合拳带来的直接优势是推理效率高、成本控制出色。官方数据显示,仅需单张H100显卡即可快速输出1080P成片。对于算力资源有限的中小创作者以及有批量商用生产需求的企业来说,这一方案大幅降低了入门门槛。

来源:https://m.mydrivers.com/newsview/1131227.html
上一篇LG Display大尺寸OLED首批获Intertek完美色彩亮度认证 下一篇豪爵UHR150升级款踏板摩托车发布售价13780元起
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿