但这里也有一层需要警惕的底色:大型语言模型(LLMs)在传播虚假信息方面的能力同样不容小觑,因此负责任的部署和适当的约束必不可少,不能放任不管。
当然,这项研究也有它的局限性。例如样本主要来自美国网络参与者,将其推广到其他文化背景的阴谋论信众身上效果如何,仍然存疑。而且实验仅使用了GPT-4 Turbo这一个模型,换成其他LLMs,表现是否同样出色,目前尚未能确定。更深层次的问题是,尽管LLMs在改变信念方面展现了惊人的效果,但其究竟通过怎样的认知机制影响人的想法——这个黑箱尚未打开,未来还需要更多机制层面的探索。
科学事实是最有力的反证依据
世界经济论坛在《2024年全球风险报告》中,将“AI放大虚假信息”列为全球最严重的风险之一。在这一背景下,AI潜在的积极影响就显得格外珍贵——上述结果至少表明,LLMs这类模型不仅能有效降低人们对特定阴谋论的相信程度,还有可能撬动那些根深蒂固的深层信念。
不过,正如Bence Bago等人在前瞻性文章中指出的,这种AI对话策略可能只对那些“有据可查”的阴谋信仰有效。如果是那种毫无根据、纯属编造的错误信念,AI的效力可能会打折扣。他们进一步提到,AI对话干预的可扩展性目前仍停留在理想状态——理论上它能覆盖阴谋论、伪科学、健康神话、气候怀疑主义等范畴,但这些不同类型的错误信念,纠正起来的难度究竟是否一致,还有待验证。
未来的研究需要回答几个实操问题:这种AI对话到底需要进行多久?隔多久进行一次才能保证效果不衰减?另外,阴谋论信众往往对任何科学机构都心存戒备,如何说服他们愿意与AI聊上一轮,本身就是一个巨大挑战。或许可以换个角度,从他们的亲友入手——那些急于纠正错误信仰的家人朋友,如果能够成为“引路人”,鼓励信众参与AI对话,说不定是一个突破口。

《Science》杂志主编H. Holden Thorp在一篇焦点文章中说得颇有深意:“LLMs或许是对抗阴谋信仰的有效工具,这听起来有些讽刺,毕竟LLMs以编造虚假事实而闻名。但在与阴谋论信众的交谈中,它们确实能减少信念。”该研究论文的作者之一David Rand也给出了判断:“我们的证据表明,真正起作用的确实是反证依据和非阴谋解释。”
Thorp接着抛出一个问题:LLMs的效果,是否与它相比人类那种“中立、不带情绪”的对话方式有关?但目前的实验尚未给出有力证据来支撑这一猜测。这些结果传递了一个重要信号:当大量反证依据变得至关重要时,减少科学错误信息的努力,或许不应过度强调“信息由谁来传递”,而应聚焦于“对立证据是否足够多、足够硬”。
H. Holden Thorp谈到一个有趣的悖论:“尽管阴谋论盛行,但公众对科学家的信任度仍然很高。”或许正是这种对科学家的坚定信任,让LLMs在提供反证依据时显得格外有效。归根结底,机器或许比人更擅长反驳错误信息,但最终让信众心服口服的仍是科学事实本身。科学家有责任继续挖掘AI在这方面的潜力,把这份可能性转化为现实。
