长久以来,互联网用户习惯于通过匿名或化名账号表达观点,以此避免被人肉搜索或遭遇骚扰。然而随着人工智能技术的迅速发展,这种匿名保护正变得越来越脆弱。
根据科技媒体Futurism的最新报道,苏黎世联邦理工学院与Anthropic的研究人员在一篇尚未经过同行评议的论文中指出,大语言模型已经具备了大规模识别匿名用户真实身份的能力。

研究团队在实验中开发了一种人工智能体,仅依靠用户在论坛上的发言和个人资料,就能识别Hacker News和Reddit用户的真实身份。研究人员指出,这类调查如果由人类来完成通常需要耗费数小时。
实验结果令人震惊:人工智能成功识别了约三分之二的用户。
论文作者之一、苏黎世联邦理工学院AI工程师西蒙·勒尔门写道:“我们的研究表明,过去保护匿名用户的‘现实中的模糊性’已经不复存在,网络隐私的威胁模型需要重新思考。”
研究团队还发现,这种方法不仅能应用在论坛数据上,在LinkedIn资料、匿名采访记录等不同数据来源之间同样有效,而且可以扩展到数万名候选对象。
过去用户普遍认为,只要使用匿名账号,别人要识别身份就需要付出极高成本。但大模型已经改变了这一前提。研究人员先将Hacker News帖子与LinkedIn账号建立对应关系,然后删除所有身份信息,使数据集匿名化。随后用这些数据训练模型,并要求模型找出帖子对应的真实作者。
勒尔门解释道:“这些智能体能够做到以前非常困难的事情。仅凭匿名采访记录等自由文本,就可以逐步推断出一个人的完整身份。”
研究团队在研究过程中也刻意避免真正揭露匿名用户身份,因此设计了专门的机制,用来评估模型能力。
结果显示,哪怕是Anthropic关于日常AI使用情况的调查问卷这类普通内容,AI模型仍然能在约7%的情况下识别出具体人员。研究人员指出,AI能够做到这一点本身就非常值得警惕。
在另一个实验中,当AI分析Reddit电影社区的评论时,识别用户身份的准确率甚至更高。用户讨论电影越多,AI就越容易锁定其身份。
研究团队同时也承认研究存在一些限制,例如样本规模较小,以及难以区分模型本身与搜索引擎在识别过程中的作用。
尽管如此,研究人员认为这一结果仍然揭示了一个令人担忧的趋势:大语言模型正在让去匿名化变得更加普遍。
研究人员总结认为,AI时代正在改变互联网的隐私格局。如果没有更强的保护措施,网络匿名可能面临终结。论文最后指出:“用户、平台和政策制定者必须意识到,支撑当今互联网的隐私假设已经不再成立。”
