业界最新动态显示,人工智能技术再上新台阶——由曹越教授领衔的Sand.ai团队近日发布GAGA-1音画同步视频生成模型。这款直接面向公众开放的创新工具,用户无需预约审核,登录官网https://gaga.art就能立即体验。 据悉,GAGA-1的研发历时半年,远超最初设定的两个月周期。该产品在人物动作捕捉和口型同步技术上取得重大突破,能够呈现影视级别的自然表演效果。经过反复测试,GAGA-1已能完美驾驭短视频创作和游戏互动需求,在电视剧制作领域展现不俗潜质,不过要达到电影级精细度仍有待继续优化。 首期开放的"Gaga Actor"模块采用标准16:9比例画幅,提供5秒和10秒两种视频时长选项。用户只需上传参考图像并输入文字描述作为台词,约3-4分钟后便可获得成片。值得注意的是,系统不仅能精准表达中文和英文台词的情感变化,还能处理复杂的双人互动场景。 在体验过程中发现,GAGA-1具备多项特色能力:既可以模拟外国人说中文时的独特口音,又支持简单歌唱表演,甚至能还原特定文化背景的人物形象。不过开发团队也坦言,当前版本存在一些局限——包括复杂动作可能变形、长篇台词易丢失细节、日语处理异常等。更值得注意的是,其内置Banana图形引擎在亚洲面孔渲染上效果欠佳,建议搭配Seedream 4.0协同使用。 针对未来规划,Sand.ai透露自定义音频和固定音色功能正处于最后内测阶段,由于研发优先级安排未能在本期上线。收费标准方面,虽然免费使用期限未定,但明确承诺最终定价将远低于Sora2、Veo3等竞品。现阶段GAGA-1已能出色胜任短视频制作、游戏角色生成、文学作品可视化等多元化创作需求,为内容生产者提供了高效经济的创作方案。 如需获取人工智能领域更多前沿资讯,欢迎关注专业媒体平台https://www.aipress.com.cn。
GAGA-1国产AI视频工具:影视级品质,超低成本创作
相关推荐
补充同频道和同主题内容,方便继续浏览更多相关内容。
同类最新
继续查看同栏目最近更新的文章。
宇树验证具身智能新趋势核心战场不止于模型
具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实
智元精灵G2机器人产线直播完成64828件成功率99.99%
99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到
纯电动Cayenne首秀保时捷驾驶中心全国路演
保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两
AI工具能否成为高价志愿咨询纠纷的破局之道
广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的
头部企业全产业链布局锂电池回收循环
近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持
