(图源:视觉中国)
蓝鲸新闻6月12日讯(记者 彭乐怡)高校应届毕业生正在面临一种新挑战:如何降低自己论文的“AI生成率”。为了应对学校日益严格的审核,他们开始了一场“用AI对抗AI检测”的策略竞赛。
近期,众多高校将AIGC生成内容检测率正式纳入了毕业论文审核体系,部分院校甚至设定了明确的比例红线。为了顺利毕业,学生们想方设法降低论文的AI标识率。然而,核心难题随之浮现:市面上的AI率检测工具质量不一,误判现象时有发生,且不同平台间的检测结果差异巨大,令人无所适从。
更引发争议的是,相关的检测与“降重”服务往往需要额外付费,甚至出现平台既提供检测又售卖降重方案的“裁判员兼运动员”现象。面对这个技术“黑箱”,一个根本性问题被提上桌面:仅凭现有工具判定论文的AI生成率,其科学性与公正性究竟如何?这是否本身就是一个待解的伪命题?
针对这一乱象,北京邮电大学计算机学院(国家示范性软件学院)教授鄂海红,这位长期专注于大数据与人工智能研究的专家向蓝鲸科技表示:“当前,行业内缺乏一个公认的、权威的第三方评测体系来客观评估各类AI检测工具的准确率与误报率。更深层的问题是,从行业标准到国家标准目前均处于缺失状态,没有强制性的规范来约束这些商业化检测服务。这正是导致市场鱼龙混杂、检测结果可信度参差不齐的根本原因。”
试图用AI降低AI率,结果不降反升
“我们学院明确规定,毕业论文的AIGC检测率不得高于30%。”来自华东地区一所985高校的应届本科毕业生谭蕙(化名)透露。她所在的学院今年出台新规,AI率超标者必须修改,否则无法进入答辩环节。
北方另一所985高校的硕士毕业生赵宜(化名)则介绍了不同情况:其学院要求提交论文时附带AIGC检测报告,但对具体工具和比率未设死线。“同学们普遍会参考传统的查重率标准,自觉将AI率控制在10%-15%的范围内。”赵宜说道。
蓝鲸科技查询发现,包括四川大学、河北工程大学、南京航空航天大学、广西师范大学在内的多所高校,今年均已对毕业论文AIGC率提出明确要求。各校甚至各院系标准各异,例如四川大学要求文科类不超过20%,理工医科类不超过15%;而南京航空航天大学则将上限放宽至40%。
毕业论文通常需上传至学校指定的学术管理系统(如知网、维普等)进行最终查重与AI率检测,并以系统结果为准。受访学生表示,这类官方系统通常只提供有限次数的免费AI检测机会。为了珍惜机会,学生们普遍选择先通过第三方工具进行预检测。

(图源:视觉中国)
初次检测,谭蕙的论文AI率为33%,刚好越线;赵宜则在多个平台测得30%-40%的比率,远超预期。多位学生坦言,在论文写作过程中确实借助了AI进行辅助。谭蕙表示,她会与AI讨论选题框架,并利用其解答写作中的疑问。“本科阶段学术训练尚浅,模仿优秀论文是常见学习路径。在语言润色和学术表达上,我会借助AI优化,但所有核心观点与逻辑框架均出自本人思考。”
为了达标,学生们开始各显神通探索降低AI率的方法。这个过程颇像“盲人摸象”,因为他们并不清楚检测算法的底层逻辑,甚至对报告本身也心存疑虑。“我论文中AI率最高的部分竟是完全由自己完成的文献综述。更让人费解的是,充满个人情感的‘致谢’部分也被标出50%-60%的疑似生成度。这个结果让我非常困惑。”谭蕙分享道。
一些第三方平台在提供检测的同时,也推出了付费降重服务。根据谭蕙提供的截图,其一篇1.8万字的论文,使用PaperYY的检测加降重服务需花费280元,而PaperPass的降重服务则约为95元。为了节省开销,谭蕙决定自行研究降重技巧。她借鉴网络经验贴,总结出“在严谨学术表达中适当融入口语化叙述”的策略,并尝试用另一个大模型来对原文进行“AI降重”处理。
然而,“用AI打败AI”的尝试遭遇了挫折。第二次检测,其论文的AI率不降反升,从33%一跃升至67%。她的导师为了帮助学生,提供了一篇“前AI时代”的硕士论文作为写作风格参考。谭蕙不得不逐字逐句推敲修改,力求在保持学术规范的同时,避免语言过于工整而被机器误判。
在学生们看来,AI率检测如同一个“黑箱”,充满了不确定性。经过不懈努力,谭蕙的第三次修改版本终于达标,但结果的戏剧性让她再次惊讶——这次检测出的AI率竟然是0%。而赵宜的经历则相反,她多次修改后AI率仍居高不下,最终只得找到一个显示AI率仅为2%的检测工具,并提交了该平台的报告。
检测结果飘忽不定,AI率判定为何失真?
“举例来说,一份显示AI率为20%的报告,其真实含义并非指有20%的文字由AI生成,而是意味着该文本与检测模型所学习的AI生成文本特征有20%的相似概率。这本质上是一个概率预测,因此其准确性本身也是概率性的。”算法工程师小田向蓝鲸科技解释道。
鄂海红教授进一步剖析了技术原理。目前,检测AI生成文本主要有不同技术路径。早期研究者采用检测文本“困惑度”的方法:模型对一段文本的预测越顺畅、困惑度越低,则越符合AI的生成模式;人类写作因其更高的随机性和创造性,通常表现为更高的困惑度。
但这种方法存在局限。鄂海红指出,学术论文、法律文件等文体本身语言高度规范、句式严谨,使用困惑度检测极易造成“误伤”。此外,困惑度阈值设定缺乏统一标准:阈值过高会导致漏检,阈值过低则误报率激增。

(图源:视觉中国)
除了这种被动检测思路,另一种主动方案是“水印技术”。即在大模型生成文本时即嵌入特定标识。鄂海红介绍,这种方法准确率相对较高,且理论上能追溯到具体的生成模型。但其局限性也很明显:首先,它依赖于大模型厂商主动集成水印,无厂商支持则无法检测;其次,目前各厂水印技术标准不一,缺乏互联互通机制,难以实现跨平台统一识别。
不同技术路径各自存在的瓶颈,恰好解释了为何会出现误判,以及同一篇论文在不同工具中结果迥异的现象。
事实上,与文本检测相比,学术界当前面临更紧迫的挑战是学术图像AI造假的鉴别。鄂海红强调,利用AIGC技术伪造科研实验图像,成本低廉但危害极大,是学术不端的新兴重灾区。目前,他的团队正致力于研发针对科学图像伪造的检测大模型。
作为教育工作者,鄂海红与对外经济贸易大学法学院讲师周瑞珏均表达了相似观点:他们不反对学生合理使用AI辅助科研与写作,因为这已成为不可逆转的趋势。“但AI的本质是提升效率的工具,而非替代人类进行科研创新或完成学术任务的主体。”周瑞珏指出,高校引入AIGC检测工具的初衷,是确保学生以合理、正确的方式使用AI,防范完全的AI代笔行为,而非扼杀技术带来的便利。
鄂海红认为,更科学的办法是倡导“使用声明”制度。在学术写作中,作者应明确标注AI辅助生成内容的具体位置与范围,并在文中集中声明所使用的工具、目的及使用程度(如AI生成内容占比),同时承诺对全文内容负责。当前的AIGC率检测报告,是在缺乏此类透明声明的情况下的一种辅助识别手段,它无法反映AI使用的具体情况,且存在误判可能,因此不宜将其数值作为硬性毕业门槛。更重要的是,如果检测本身演变成学生毕业路上的额外经济与精力负担,那就背离了教育的本意。
