力压Seedance!阿里HappyHorse两周后上线:4月30日开放API
4月15日消息,阿里ATH旗下创新事业部研发的视频生成模型HappyHorse-1.0,近日已悄然在Arena.ai平台上线开放测试。目前,模型正处于正式发布前的最后优化阶段。
根据最新反馈,早期评测结果显示该模型在视频编辑任务中表现尤为突出。预计将在两周后,也就是4月底,正式推出版本更新。
经阿里内部消息确认,该模型的API接口将于4月30日对外开放。目前,社区早期体验入口已经开放,官方正邀请用户参与测试并提供反馈,以期在最终发布前进行最后一轮打磨。
有意思的是,就在上周,这个模型突然以匿名身份空降全球权威AI平台Artificial Analysis的Video Arena盲测榜单。结果一出,颇令人意外——它在文生视频和图生视频(无音频)两个赛道上,同时压过了字节跳动的Seedance 2.0和快手的可灵3.0,强势登顶榜首。
技术层面,HappyHorse-1.0采用了一个150亿参数的40层单流自注意力Transformer架构。这个架构最大的亮点,在于实现了原生音视频同步生成。
这么说吧,市面上多数视频模型的工作流程,往往是先“默片”后“配音”:先生成一段无声视频,然后再想办法配乐、对口型。几道工序下来,不仅耗时费力,音画不同步的问题也时有发生。
而快乐马模型则把这两道工序彻底合并了。画面和声音的生成被整合进同一个流程,一次前向推理,直接输出带声音的成片,中间省去了任何后期拼接的步骤。这不仅仅是效率的提升,更是生成逻辑上的一次简化。
此外,该模型还原生支持英语、普通话、粤语、日语、韩语、德语和法语共七种语言的唇形同步。这意味着,在多语言内容创作上,它或许能提供更原生、更自然的体验。

