本文总结了关于AI未来的几项核心判断。近期,Simon Willison分享了他使用Gemini Deep Research的真实体验,并在此基础上做出了一系列颇具深度的远期预测。这些预测跨度从三年到六年不等,既有乐观展望,也不乏悲观预警。不过,这篇文章并非空泛的推测,而是基于他当前的实际工作以及已经观察到的明确趋势。
先来看看他目前如何运用Deep Research。这款工具能够根据一个谷歌搜索指令,自主制定研究计划,访问数十个网站,最终整合出一份附带重要引用的综合报告。
例如,当它查询2016至2019年太平洋棕色鹈鹕的调查报告时,能够精准提取隐藏在PDF文件中的大量细节。Simon最看重的正是这些细节——报告中列出的数据让他印象深刻:他这才知道,支柱点港(Pillar Point Harbor)原来是该物种的第二大栖息地。

对Simon而言,当前的大语言模型(LLM)已经完全能够用来构建个人科研助手。它们可以调用各类工具,制定相对基础的研究计划——本质上就是搜寻新闻文章和研究论文。而且,只要搜索到足够的上下文信息,模型就能整合出可信的答案。谷歌在这方面优势尤为突出:拥有全球最大的网站索引,同时Gemini的上下文窗口容量高达200万个token。Simon认为,Deep Research的能力将持续提升,并且竞争格局很快就会形成。
三年后:AI辅助调查报道斩获普利策奖
Simon做出了一项连他自己都承认“有些自利”的预测:三年之内,将有人因为在调查报道中使用了生成式AI工具而获得普利策奖。
请注意,这里并非指LLM直接撰写稿件。他始终认为,让LLM代笔写作是最无趣的应用之一。之所以说这个预测带有自利色彩,是因为他真心希望自己能够推动这件事成真。
他开源了数据新闻工具包Datasette,并持续为其添加AI功能。比如,利用LLM进行数据增强:从非结构化文本中提取结构化信息,直接转化为表格。

他的理想就是这些工具——或者类似的产品——最终能够应用于获奖的调查报道中。选择“三年”这个时间窗口,是因为他认为让大众普遍学会如何负责任、高效地使用这些工具,并将其真正融入实际工作流程,需要这样的周期。
必须承认,LLM与新闻业天然存在矛盾。记者追求真相,而LLM容易产生幻觉、编造事实。但换个角度思考,记者恰恰擅长从不可靠的信息源中提取有价值的内容——这本来就是新闻工作的核心能力之一。Simon认为,LLM在新闻业有两个特别适合的领域,他希望能成为这些工具的开发者。
因此,他给出的具体预测是:三年内,有人会在少量LLM辅助下赢得普利策奖。更宽泛的预测是:到那时,大多数专业新闻人会将LLM作为日常工作的标准配置,使用方式越来越复杂,但大家反而习以为常,以至于视而不见。
三年后:隐私法规将落地实施
另一个三年后的预测聚焦于隐私立法。关于定向广告以及用户提交到模型中的数据去向,人们一直存在疑虑——而且很多时候确实有理由担忧——这种不安情绪仍在升温。
Simon曾撰文指出,苹果通过监听手机麦克风做定向广告,这属于那种“永远无法根除的阴谋论”。

他之前也写过关于AI信任危机的文章:很多人就是不相信模型不会拿他们输入的数据去训练,哪怕公司反复否认也无济于事。

他反而认为,AI行业本身会从立法中受益,特别是在用户提交数据的训练用途方面需要更明确的规则。而整个科技行业,在数据留存和定向广告上,也确实需要更严格的规范。未来四年,他不指望美国联邦政府能通过相关法律,但预计在州级或国际层面,能看到更多具有实际执行力的隐私法规。当然,他希望这不会催生出新一代的cookie同意弹窗。
六年后的乌托邦:令人惊叹的艺术创作
对于六年后的预测,Simon选择了截然相反的两条路径,一条乐观,一条悲观。他认为六年时间足够长,人类能够找到利用AI技术创作出真正伟大艺术作品的方法。
他并不认为生成式AI用于艺术创作——比如图像、视频、音乐——能获得与文本LLM同等的尊重。生成式艺术工具虽然有趣,但输出缺乏精细控制,这大大限制了它们的实用性,目前最多只能生成一些个人消遣的内容。更关键的是,它们缺乏社会认同。整体氛围上,大家看待AI生成的艺术作品时往往不太顺眼。许多有才华的艺术家强烈反对这些工具,“AI”这个词汇在社会上甚至开始带有贬义色彩。图像和视频模型之所以成为AI训练数据伦理争论的焦点,原因很简单:没有哪个艺术家愿意自己的作品未经授权就被拿去训练模型,然后模型反过来直接与他们竞争。
Simon认为六年时间足以让这一切尘埃落定——让社会找到真正能提升人类表达方式的可行路径。令他兴奋的是,真正有才华、有远见、有创意的艺术家,会利用这六年里演变出来的工具,创作出有意义的作品。这些工具将变得不可或缺,否则那些艺术就不可能实现。
他在播客中提到了《瞬息全宇宙》(Everything Everywhere All at Once),这部影片在2023年斩获七项奥斯卡奖。其视觉特效团队核心成员仅有五人。试想一下,如果给他们配备六年后才可能出现的GenAI工具,他们能创作出怎样的作品?

有趣的是,播客录制后,Simon从Swyx那里得知,Runway ML其实已经应用在《瞬息全宇宙》的制作中。他在播客中预测,使用GenAI工具的电影会在六年内获得奥斯卡奖。现在看来,这个预测已经晚了八年。
六年后的反乌托邦:大规模社会动荡
2031年的悲观预测,落在了“AGI”上。这个术语的定义一直在演变。此前有报道称,微软和OpenAI目前将AGI定义为能创造1000亿美元利润的系统。如果假设AGI能够执行目前人类承担的所有岗位,就很难不去思考潜在的负面后果。奥特曼可能尝试过全民基本收入,但美国现在连全民医保都解决不了,更不用说全民基本收入了。

当大多数工作被机器取代时,很难想象未来的经济还能为大多数人服务。因此他对2031年的悲观预测是:如果这种形式的AGI真的到来,它将带来极其糟糕的经济后果和大规模的社会动荡。
他心目中的AI乌托邦,是那种能够增强人类能力的工具。这正是目前利用LLM在做的事情。他理想的状态是这些工具不断改进,最终让人类能够完成更宏大的工作。如果存在一种AGI能够实现这种乌托邦,他愿意全力以赴。
作者介绍

Simon Willison是一位英国程序员,社交会议目录Lanyrd的联合创始人,也是Web框架Django的联合创造者。2010年末,他联合创立了Lanyrd,之后被收购。2019到2020年,他在斯坦福大学担任约翰·S·奈特研究员(JSK fellow),开始构建服务于数据新闻学的开源工具生态。从2002年开始,他一直坚持在个人博客上撰写文章。
