游乐游手机版
首页/科技数码/文章详情

AI解读荷塘月色超六成专家分析结果令人意外

时间:2026-05-24 16:02
还记得朱自清的《荷塘月色》吗?“曲曲折折的荷塘上面,弥望的是田田的叶子。叶子出水很高,像亭亭的舞女的裙……” 这篇全文1361字的经典散文,今天几乎在热搜上挂了一天。起因是有网友发现,它被某AI检测工具判定:AI疑似生成率超过60%。 评论区顿时炸开了锅。有网友调侃,“那我的论文AI率80%,是不是

还记得朱自清的《荷塘月色》吗?“曲曲折折的荷塘上面,弥望的是田田的叶子。叶子出水很高,像亭亭的舞女的裙……”

这篇全文1361字的经典散文,今天几乎在热搜上挂了一天。起因是有网友发现,它被某AI检测工具判定:AI疑似生成率超过60%。


评论区顿时炸开了锅。有网友调侃,“那我的论文AI率80%,是不是也正常了?”也有人怀疑检测结果是随机生成的;更有网友爆料,同一篇文章在不同平台查出的AI率能相差30%。

这到底是怎么回事?AI检测工具究竟靠不靠谱?我们跟西湖大学文本智能实验室的博士、Fast-DetectGPT研发者之一鲍光胜聊了聊。他的第一个回答,就有点出人意料。

“大家对AI率有误解”

关于AI率,鲍光胜认为,公众首先可能存在一个普遍的误解。“比如一篇文章检测出AI率60%,并不是说每100个字里面,就有60个字是AI写的。这个‘率’实际上是指一篇文章有多大概率由AI整体生成,60%就意味着它有60%的概率是AI写的。”

检测工具其实无法分辨,也不能精准指出哪几个字出自AI之手。“因为在微观层面,一两个字的差别,人类和AI几乎看不出来。”

那它是怎么判断的呢?简单说,就是在宏观层面寻找统计上的线索。例如在用词方面,AI会有相对固定的偏好。某个冷门词出现的频率如果远高于人类写作的平均水平,就会成为一个统计信号。

鲍光胜举了个例子:有研究发现,大模型应用于英语学术论文写作时,单词“delve”(深入研究)的使用频率大幅提高,“这时,这个词就可以作为一个特征信号”。

但这种特征是统计意义上的,“它需要在一篇文章中反复出现某些可被检测的信号。因此,如果只给出一段很短的文字,是无法准确判断的。”鲍光胜认为,目前的检测工具对于100字以下的“小作文”判断通常不太准确,到了500字左右,结果就比较可信了。

《荷塘月色》是怎么被误伤的

那么,《荷塘月色》超60%的AI率是怎么回事?


“以现在的检测技术,如果是全新写的文章,AI率可能更准些,老文章反而不一定。”鲍光胜先给出了一个结论。

原因很简单:那些脍炙人口的经典文本,绝大部分早就被用来训练大模型了。

“AI检测的基本原理是这样的:把你的一篇文章放到大模型里,看它的用词、词频分布等,和模型预测的分布是否一致。”通常情况下,如果是AI生成的文字,那它和模型的预测会比较一致。

于是,问题就来了:当AI检测工具遇到在学习阶段就“读”过的经典文本,这种“一致性”就会因为模型熟悉这些表达而变得很高,进而倾向于判断文章是AI写的。《荷塘月色》大概率就是这样被误伤的。

AI模仿的是整个人类的写作共性

在评论区的热门位置,有网友反映自己的同一篇文章,不同平台查出的AI率相差30%。鲍光胜说:这太正常了。

“市面上各个检测工具用的算法不一样,有的主要看词频,有的侧重语法,有的看语义。单独一篇文章,差30%一点都不奇怪。”

今天的热搜里,还提到了一个现象:有些平台一边卖AI生成论文,一边又提供降AI率服务。

“这就是互相攻防。”鲍光胜继续解释。

降AI率的原理,说起来并不神秘:研究市面上的检测工具喜欢抓什么特征,比如某个词用得太频繁,那就把它换成另一个意思相近的词。“更换后意思不变,但检测工具就抓不到了。”

他同时也提到,对抗检测最好的方式或许是保持自己的写作风格。“AI是在模仿整个人类的写作共性。如果你有非常独特的个人风格,AI反而不太容易抓住。”这就是为什么有些人的文章AI率很高,而另一些人却没事,后者可能天生就不按套路写。

AI检测AI,未来是持续的攻防战

鲍光胜博士的研究方向是AI生成文本检测,他从2024年底ChatGPT问世后就开始关注这一问题。

“当时觉得随着AI应用的普及,它会变得越来越严重。互联网上AI生成内容越来越多,会侵蚀人与人之间的信任,比如教育场景中的师生关系。另外,AI生成的东西,人类单靠自己会越来越难分辨,需要‘AI检测AI’”。

他所在的西湖大学文本智能实验室研发了Fast-DetectGPT,这是一个可以快速并准确检测文本是否由AI生成的工具,相关成果发表在国际会议ICLR 2024上。

鲍光胜坦言,未来会是持续的攻防战:大模型越来越强,AI检测技术跟着升级,然后新的模型又来了……

“网上不少人可能觉得,检测工具说这篇文章是AI写的,那就一定是。但任何AI检测工具给的都只是概率,这个概率有一定可能是错的。”他强调说,这个观念,才是最需要传递给大家的。

至于有学生网友在网上“喊冤”,说自己手搓的论文被判了高百分比的AI率,鲍光胜给出了三种可能:要么不是完全自己写的,要么不自觉受了AI模板影响,要么就是检测工具本身不准。“越来越多人在写作中用AI给的模板做参考或直接润色文字,AI已经在影响人类的用语习惯。”

来源:https://www.163.com/dy/article/KTINN2EJ051492LM.html
上一篇惠普暗影精灵15游戏本PTL版发布可选配OLED显示屏 下一篇瑞金医院360度旋转治疗室启用实现肿瘤精准放疗新突破
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5

电动汽车电池新国标7月实施热失控不起火不爆炸
科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起,两项关乎电动汽车安全的核心强制性国家标准将正式实施,为行业加装“安全锁”——《电动汽车安全要求》(GB 18384-2025)与《电动汽车用动力蓄电池安全要求》(GB 38031-2025)同步落地。此次标准升级,从整车架构与电池系统两大维度,精准填补了近年来多起事故暴露出的