游乐游手机版
首页/AI热点日报/热点详情

阿里AI PPT 6G 6小时音视频一键生成

类型:热点整理2026-06-03
AI自动生成PPT已不再是新鲜事。市场上众多工具都支持通过输入标题一键生成演示文稿,此前Kimi的PPT功能就曾引发广泛关注。 然而,阿里通义此次升级令人瞩目——它将AI PPT的能力从单纯的文本处理,拓展至音视频内容的解析与转换。 具体而言,通义目前支持解析6GB视频或6小时音频,并将其转换为PP

AI自动生成PPT已不再是新鲜事。市场上众多工具都支持通过输入标题一键生成演示文稿,此前Kimi的PPT功能就曾引发广泛关注。

然而,阿里通义此次升级令人瞩目——它将AI PPT的能力从单纯的文本处理,拓展至音视频内容的解析与转换。

具体而言,通义目前支持解析6GB视频或6小时音频,并将其转换为PPT。你没看错:6GB、6小时。文档上传上限达1000万字,长文本生成PPT的能力覆盖10万字篇幅。

坦白说,10万字生成PPT的功能在日常中应用频率不高。但音视频解析能力才是真正的亮点——设想一下,数小时的会议录音、培训视频或讲座录像,以往需要手动听写、整理、提炼,现在交给AI即可一步到位。

带着好奇,我们进行了实际测试。

打开首页,场景模板十分齐全:涵盖课题研究、商业计划书、产品演示、工作汇报、述职报告等。选好类型,点击上传文件即可。上传格式支持音频、视频、PDF、图片,还包括HTML和Markdown。

手头暂无合适的长视频,但正好有一份《AI视频生成研究报告》的PDF,内容较多,一直未读完。于是将其交给通义,由它代为梳理。

文件解析后,首先生成大纲,支持在线调整。同时需选择PPT的演讲场景——此处选择“课题研究”。接着挑选模板,任务随即进入自动生成流程。

生成的PPT可在线上编辑,确认无误后导出。输入的PDF原文约40页,最终产出21页PPT。从目录看,它完全按照课题研究的逻辑重构了内容结构,而非简单摘抄。

值得注意的是,选择不同的汇报场景,生成的PPT内容和风格差异显著。这意味着内容的组织逻辑会根据场景进行定制化适配——这对办公场景而言是非常实用的设计。

初体验:提效还省钱

整体体验下来,通义AI PPT最核心的亮点在于打通了音视频、PDF、图片到PPT的转换链路。以往将视频或录音转为PPT,至少需经历“转文字→提炼大纲→制作PPT”等步骤,中间可能还需借助多个付费工具。

如今一步到位,既省时又省钱。

当然,它并非完美。例如虽然支持HTML格式上传,但实测两个网页链接均提示格式不符合要求——这一点需要更清晰的说明。

但总体而言,通义AI PPT因集成了通义听悟强大的音视频处理能力,确实将“AI做PPT”提升到了新台阶。试想,参加完一场长达数小时的会议后,将录音直接交给它,几分钟后一份结构化PPT便呈现眼前。这种效率提升是实实在在的。

结论?上周撰写Kimi PPT时还说不用熬夜做PPT,现在看来,今后彻底无需为PPT发愁了。

来源:https://www.53ai.com/news/neirongchuangzuo/2024090443681.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。