淘宝直播间LLM智能化升级与数据分析_AI热点日报

淘宝直播间LLM智能化升级与数据分析

类型：热点整理2026-06-01

针对淘宝买菜直播业务起步晚、人工学习效率低的问题，提出基于大模型的智能化方案：利用FFmpeg下载视频音频，借助听悟工具转文本后，用大模型分析话术与布景亮点。上线后总结质量达运营标准，落地优惠券推送等玩法。未来将优化提示词并叠加流量因子。

先介绍一下整体背景。淘宝买菜直播业务起步较晚，长期面临较大业务压力。运营团队自然希望借鉴那些表现优异的标杆直播间，将它们的成功经验融入自身直播中。

淘宝直播间智能化升级：基于LLM的学习与分析

初期策略 - 人海战术，对标学习

业务侧最初最直接的想法是采用“人海战术”。简单来说，就是让运营小二人工盯防各个直播间，提炼出对方做得出色的地方，再组织大家一起分享学习。

运营TL提出的要求，以及运营小二人工学习的参考范本，大致遵循这样的路径。

效果确实不错。但弊端也很突出——人工学习过于消耗人力。运营同学几乎每天都要花费大量时间蹲在直播间里琢磨，哪还有精力去做真正意义上的“运营”工作？

熟悉LLM的朋友看到这里，估计已经意识到：这些运营总结出来的内容，怎么看起来像大模型生成的？换句话说，基于LLM的总结能否达到类似甚至更好的效果？

如今各个文本平台都有“速看”功能，我们自然也可以考虑：能否利用LLM对标杆直播间进行学习总结，从而把运营同学解放出来，让他们回归到真正的“运营”本职上？

方案设计

整体方案拆解为三个步骤：

使用ffmpeg将m3u8格式的直播回放视频和音频下载到本地
通过集团内部的听悟工具，将音频转写成文本
用文本大模型提取话术亮点，进行多直播间横向对比；用图像大模型分析布景亮点，同样做横向对比

Step1：基于FFMPEG下载视频与音频

为什么要用FFMPEG？这要感谢GPT的帮助。下载视频和音频主要涉及两类核心命令：

视频下载：ffmpeg -i "http://example.com/playlist.m3u8" -c copy output.mp4
音频下载：ffmpeg -i "http://example.com/playlist.m3u8" -vn -acodec libmp3lame output.mp3

具体语法询问GPT即可，此处不再展开（不得不说，GPT解决编程问题确实高效）。

Step2：将音频转换为文本

这一步基本是傻瓜式操作：上传MP3文件，稍等片刻即可获取解析好的台本。之后可以导出为srt、docx、pdf等格式。

Step3：基于大模型对文本进行概要总结

Prompt和LLM输出的总结内容示例如下所示。

（此处插入原文中“话术分析”、“视觉分析”、“评论分析”三部分详细的Prompt和模型输出示例）

关键难点

1. 视频截断问题

录播时长有时很长，实践中经常遇到视频音频体积过大、时长过长导致无法上传的情况。针对这个问题，有两种解决方案：

方案一（最终采纳）：通过ffmpeg压缩音频码率，在不影响效果的前提下减小文件体积。
方案二：使用开源剪辑软件，将视频切分为多个片段后再上传。

2. Prompt调优

要想获得理想的总结效果，高质量的Prompt至关重要。调优Prompt虽然有一些可遵循的原则，但整体上仍偏“玄学”，需要反复尝试。

（此处插入原文中“调优后的Prompt”具体内容）

在实际调优过程中，有几个经验值得分享：

逐步拆解：这一步确实关键，能让大模型按照我们期望的格式和思路输出。
简明扼要且具体：描述越具体、越简洁，模型越能抓住重点，输出也更贴合主题。
提供参考示例：有了示例，模型回答确实不会偏离太远，但也容易导致它只围绕我们提到的点来回答，甚至产生幻觉。
角色代入：实践发现，明确输出对象的角色（如产品经理、直播运营、主播），效果比不明确角色要好很多。让大模型自行假设角色，效果反而一般，可能“数据分析师”这类角色对模型来说还是太抽象。
人工优质文本示例：这个方法尝试过，但效果不如不用——不仅没有提升，反而让模型产生更多幻觉，输出的内容与当前输入的台本对不上。

在模型选择上，我们测试了市面上几个主流的大语言模型，实际效果显示GPT-4o最为稳定。

3. 评论分析

基于同样的思路，我们还开发了评论分析功能。将直播间的用户评论抓取下来，构建合适的Prompt丢给大模型分析。此处不再赘述。

上线效果

基础链路搭建完成后，又配套打通了工程链路。运营配置好想要学习的直播间，LLM自动输出学习总结，产品同学简单审核加工后，每天自动在群里推送。

（此处插入原文中“话术学习示例输出”、“布局学习示例输出”、“评论分析示例输出”三部分详细展示）

可以看到，LLM分析出的内容已经能够达到运营学习标准——言之有物，并能输出一些后续在运营、产品、技术侧真正可执行的策略。

业务侧也给出了不少正面反馈。基于LLM学习总结挖掘出的一些新玩法，比如优惠券自动推送、商品智能推荐等，后续都以产品化方式落地，效果不错。台本中的闪光点沉淀到了运营标准话术库中，评论挖掘的内容则为后续选品提供了参考。

未来展望

经过这一轮实践，我们确实感受到了LLM结合具体业务场景带来的切实提升。但同时也看到了它的短板：总结有时仍偏宽泛，面面俱到但不够聚焦；推理和洞察能力还有提升空间；不调参的情况下，自迭代也比较困难。

后续重点将放在以下几个方向：

持续打磨Prompt，使输出的学习总结更具针对性，为运营和产品同学提供更大的参考价值。
在学习总结中叠加实时流量因子，明确哪些话术片段真正带来了场观提升，这样后续发力方向也能更清晰。
将LLM与直播应用做更深度的结合，例如基于LLM打造选品Copilot、结合Alive组件开展更多创新互动玩法、流量分析等。

期待LLM与直播业务的结合，能带来更多实实在在的改变。

来源：https://www.53ai.com/news/zhinengyingxiao/2024122672951.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。