游乐游手机版
首页/AI热点日报/热点详情

利用Kimi实现微信群消息自动统计与数据处理

类型:热点整理2026-05-29
通过Kimi大语言模型,无需编程即可对微信群聊天记录进行自动统计与分析。操作包括导出并清洗聊天文本,利用提示词提取发送者与日期,统计关键词频次和话题分类,生成分时段发言摘要,最后导入Excel完成可视化补充分析。

聊微信也能这么玩?没错,Kimi这个大语言模型,现在可以帮你把群里那些海量聊天记录,变成一份结构清晰的统计数据。不用写代码,不用学正则表达式,只要会“说话”,就能完成从整理到分析的全过程。下面就是一套完整的操作路径,同样适用其他支持文本处理的AI工具。

如果您一直想对微信群消息进行自动统计和分析,但又觉得编程的门槛太高,那Kimi这类文本理解工具正好可以填补这个空白。它能帮我们把信息提取和汇总这件事,做得又快又直观。具体怎么操作?一步一步来看。

一、导出微信群聊天记录并整理为纯文本

第一步嘛,自然是要先把这些“原材料”倒腾出来。微信官方没有提供一键导出结构化数据的功能,所以我们需要手动拿到原始的聊天文本,作为后续分析的语料。这一步很关键,直接决定了后续分析的质量。

具体操作分四步:

1、在电脑端微信打开目标群聊,点击右上角的“更多”(三个点)按钮。

2、选择“查找聊天记录”,再点击右上角的“筛选”,勾选“全部消息”,然后滑动页面到最顶部,加载完整的历史记录。

3、借助第三方工具(比如WeChatExporter)把聊天记录导出为HTML格式。接着用浏览器打开这个文件,全选复制全部文字内容,粘贴到一个纯文本编辑器里。

4、清理工作是最耗神的:删除所有头像占位符、系统提示行(比如“你加入了群聊”这类)、图片、视频、链接等非文本标记。最终只保留“昵称:消息内容”这种逐行格式的文本。越干净,后面Kimi处理起来越顺手。

二、使用Kimi识别消息发送者与时间戳

Kimi的上下文理解能力很强,我们可以通过提示词,引导它从这种非标准文本中抽取出每句话的“谁说的”和“什么时候说的”。这是后续按人、按时段统计的基础。

1、把清洗好的文本直接粘贴到Kimi的对话框,然后输入提示词:“请逐行分析以下微信群聊天记录,提取每条消息的发送者昵称和日期(格式为YYYY-MM-DD),忽略无昵称的系统消息。输出为表格形式,列名为‘发送者’‘日期’‘原始消息’。”

2、等Kimi返回结果后,先快速扫一眼,检查有没有昵称混淆(比如有重名的)或者日期缺失的情况。

3、如果有部分消息没被识别,就把这些“漏网之鱼”单独复制出来再试一次。在提示词里加一句说明:“特别注意识别那些以‘[表情]’结尾、或者含‘……’省略号的短消息,这些消息的发送者通常和前一条相同。”

三、指令Kimi完成关键词频次与话题归类

设定好分类维度和关键词范围后,Kimi可以对消息正文进行语义层面的分类与计数,直接替代人工一条一条看。

1、给Kimi提交指令:“基于已提取的‘原始消息’列,统计以下关键词出现的总次数:‘报名’‘缴费’‘截止’‘通知’‘修改’‘确认’;同时判断每条消息属于‘事务类’(包含上述任何一个词)还是‘闲聊类’(不含且语气比较轻松)。”

2、要求Kimi分两部分输出:第一部分是一张关键词频次表;第二部分是给每条消息新增一列,标注“事务类”或“闲聊类”。

3、这一步需要做个抽样检查。从Kimi的标注结果里随机挑10条看看,如果发现误判(比如“今天天气真好”被标成了“事务类”),那就调整一下提示词,再补充个示例:“像‘天气’‘吃饭’‘哈哈’‘收到’这类词,默认归为闲聊类,除非它紧挨着‘报名’‘截止’这些关键词。”

四、利用Kimi生成分时段发言热力摘要

Kimi对自然语言中的时间表达理解得不错,不需要正则匹配,直接让它按小时或半天来划分,就能得到一份活跃度的描述性结论。

1、把带“日期”列的数据再喂给Kimi,发出指令:“请按日期+时间段(上午/下午/晚上)分组,统计每组内发送者的人数与总消息数;指出哪一天、哪个时间段发言最密集,并列出该时段发言最多的前三名高频发送者。”

2、要注意Kimi会不会把“20:30”“晚上8点半”“20点后”这些说法统一归到“晚上”区间。如果发现有歧义,就在下一轮提问里把定义说清楚:“所有18:00至23:59视为晚上,6:00至11:59为上午,12:00至17:59为下午。”

3、把Kimi输出的分组统计结果保存下来。比如它可能会给出这样的表述:晚上时段发言量占比达62%张三在周三晚上共发送47条消息。这些数据直接就能用在汇报里。

五、将Kimi输出导入Excel进行可视化补充分析

Kimi本身不能直接生成图表,但它的结构化文本输出可以很方便地喂给Excel。用Excel的公式和透视表功能,就能完成最终的呈现闭环。

1、把Kimi返回的表格结果全选复制,在Excel里用“选择性粘贴→文本”的方式贴进去,这样可以避免格式错乱。

2、对“发送者”列使用数据透视表,把“发送者”拖到行区域,把“原始消息”拖到值区域(计数),这样马上就能得到每个人的发言总量排名。

3、插入一个簇状柱形图,横轴是发送者,纵轴是消息数。再添加一个条件格式,让发言数超过平均值150%的单元格自动标黄,一眼就能看出谁是群里的“话痨”。

来源:https://www.php.cn/faq/2553589.html?uid=969633

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。