11月8日公布的最新研究揭示,人工智能模型在社交媒体互动中存在一个显著特征——它们往往因为表现得"过于彬彬有礼"而容易暴露身份。这项由苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学联合开展的实验表明,当AI参与社交对话时,因普遍采用温和友善的交流方式,反而凸显了其非人类特质。
研究团队开发的自动化分类系统在Twitter/X、Bluesky和Reddit三大社交平台进行了实测,结果显示该系统能以70%至80%的准确率识别出AI生成的回复。这意味着当用户在社交媒体上遇到措辞异常得体、态度过分友好的互动对象时,对方很可能并非真实人类。
为更精准区分机器与人类语言特征,研究人员引入了名为"计算图灵测试"的全新框架。与传统依赖人工判断的图灵测试不同,该框架通过自动化工具配合语言学分析,对文本的情感模式、语义结构等特征进行量化评估,从而有效追溯内容来源。
项目负责人、苏黎世大学学者尼科洛·帕根指出,即便对模型参数进行调整或优化输出风格,AI在情绪表达和情感基调方面仍与人类存在显著差异。这些深层的语言特征成为辨识AI内容的关键依据。
研究发现的"毒性特征暴露"现象揭示了一个普遍规律:在测试涵盖的九款主流开源大语言模型中,包括Llama 3.1、Mistral 7B、Deepseek R1和Qwen 2.5等,当被要求回复真实用户的社交帖子时,其生成内容几乎始终缺乏人类常见的随意性负面情绪或直率的情感爆发。在所有测试平台中,AI回复的"毒性"评分——即反映攻击性或消极情绪水平的指标——均明显低于人类实际回复。
为缩小这一差距,研究人员尝试了多种改进手段,例如提供人类写作样本作为参考,或利用上下文检索增强生成内容的相关性。尽管这些方法在句长、词汇多样性等表层语言结构上取得了一定效果,但情感表达方面的本质差异依然难以消除。这表明,教导AI表现出类似人类的冷漠、讽刺甚至粗鲁,可能比提升其逻辑推理能力更具挑战性。
