10月15日消息,据SEO公司Graphite发布的最新报告显示,他们对2020年1月至2025年5月期间发布的6.5万篇英文文章进行了系统分析。该报告采用了名为Surfer的AI内容检测工具,结果显示,当文章中超过50%的内容由大语言模型生成时,即被判定为AI生成内容。
分析数据表明,自ChatGPT问世后,AI生成文章数量呈现爆发式增长。从2023年末约10%的占比,到2024年已突破40%,随后增长速度逐渐趋于平稳。
目前,AI文章的增速已接近稳定期。2024年11月,AI内容占比达到峰值,此后新发布的AI与人工创作内容基本各占半壁江山。截至今年5月,新增AI文章占比达52%,而此前一个月,人类创作内容曾短暂占据多数。
值得注意的是,人类创作内容的实际比例可能被低估。研究人员使用的Common Crawl数据集收录了数千亿个网页。Axios报道指出,由于AI公司普遍使用这些数据训练大语言模型,许多付费网站已屏蔽Common Crawl的抓取,这意味着大量纯人工创作的文章可能未被纳入统计范围。
从报告披露的信息来看,AI检测工具的准确性并非百分之百可靠。Graphite在测试Surfer时,分别分析了一组AI文章和一组人类创作文章。结果显示,该工具将4.2%的人类文章误判为AI创作,而将AI文章误判为人类创作的比例仅为0.6%。
关于AI内容为何进入"平台期",目前业界尚未形成统一结论。外媒Axios引述Graphite的另一份报告指出,内容农场生产的低质量内容在搜索引擎和聊天机器人中的权重持续下降。数据显示,谷歌搜索结果中86%的文章由人类创作,AI生成内容仅占14%。
与此同时,越来越多创作者在写作过程中借助AI工具进行辅助,这使得人工创作与AI生成的界限变得日益模糊。
加州大学洛杉矶分校计算机科学教授、亚马逊云服务副总裁Stefano Soatto向Axios表示:"当前的情况更像是一种共生关系,而非简单的二元对立。"
