最近,NotebookLM悄悄更新了一个新功能,结果瞬间刷爆了科技圈。

比较遗憾的是,目前仅支持英文。不过,通过飞书提取出AI播客的章节摘要并翻译成中文,倒是个不错的折中方案。
想象一下,在后台运行的模型,不断编写并实时编辑对话脚本。除了对话本身的娱乐性,它最重要的职责是揭示真知灼见:不只是简单总结资料,还要找出其中最有趣、最令人意外的部分。现在看来,NotebookLM确实做到了。
最让人印象深刻的是「主持人」的设定——一男一女,声音自然流畅,完全不同于常见的AI语音播报。他们用「嗯」「you know」来停顿,甚至还会刻意结巴。用「好的,事情是这样的」来介绍观点,用「exactly」这类口语来强化对方观点,整个对谈流畅自然。难怪《华尔街日报》专栏作者Ben Cohen会说,AI让他大吃一惊的只有两次,「一次是第一次接触ChatGPT。这是第二次。」
「我不知道该感到惊讶还是害怕,」《Acquired》——一档热门商业类音频节目——的主持人之一Da vid Rosenthal,在亲自体验后给出了这样的评价。

事实上,NotebookLM早在2023年就推出了,但一直不温不火。直到近期上线「播客」功能,才彻底引爆了全网「复杂文档转播客」的风潮。现在10个NotebookLM用户里,恨不得有9个人都在玩这个新功能。比如,有人直接将今年诺贝尔物理学奖得主Hinton的得意门生——Ilya推荐的所有经典论文,一口气整成了播客。
原因很简单:不是每个人都能通过阅读高效学习。对于听觉型学习者来说,播客这种方式可能更有效。
还有用户把自己的账单变成了一个关于如何在Uber上「败家」的播客。AI主持人甚至会在节目中表示,因为该用户的奢侈而感到「羞耻」。

数据集也能变播客?没错,用来详细解释数据集,意不意外?

NotebookLM编辑总监甚至介绍了一个超赞的学习方法:用手机(或录音笔)录制课堂音频,再辅以手动笔记,简单记下课题重点。然后,把课堂录音和笔记一起上传到NotebookLM,做成一个播客。每周末听听这些播客,并与它们交流,就等于把最重要的课堂知识重新回顾了一遍。

顺便说一句,谷歌还有另一个很棒的播客实验产品——Illuminate,不过它目前更专注于学术文本,语气通常也更严肃。
-2-「一鱼多吃」与隐藏的超能力
除了播客生成,「笔记本指南」这个版块提供了五个最常用的「吃鱼」方式:常见问题解答、学习指南、目录、时间轴、简报。

视频下方,还显示了英文原文。以霉霉2022年在纽约大学毕业典礼上的演讲为例——「常见问题解答」可以自动总结出一些问题,帮助快速了解视频内容。

「学习指南」则像做阅读理解,对视频内容进行深度解读。「目录」,顾名思义,就是画出内容的「地图」。而「简报」就是要点总结。因为很难从这篇演讲中抽出时间轴,我们选择了一篇讲述今年诺奖医学奖得主的人物故事,来展现「时间轴」的好处。


不过,最让人印象深刻的功能,是和内容的自由「交谈」。你可以选择系统推荐的相关问题,也可以自由发问。



真正的亮点在于回答背后的超能力:基于可信来源的事实核查。几乎每句回答的结尾处,都有相应的注释。点击数字,系统会立刻追溯到原文出处。比如,数字「1」,直接追溯到原文段落(左侧)。

其次,针对原文中并无明确证据的地方,回答会予以说明和强调。比如,斯诺登并没有讨论过网络实名制,回答会补充说明,这是「推测」出来的分析。

而对于完全超出文本范围的内容,则直接拒绝回答。

最后,NotebookLM还有一个很厉害的能力:可以发现文本之间的知识关联。比如,霉霉演讲、李笑来的《财富的真相》、斯诺登传记《永远记录》以及《批判性思维》等文本背后,思维模式的共同点。再比如,批判性思维和财富思维有什么共通之处?


在结束本文之前,有必要提一嘴大模型的「幻觉」问题。Ethan Mollick早在2023年就用过NotebookLM,当时他就发现它相当不准确,尤其是在数字方面。

不过,他最近注意到,再用同样的问题测试,NotebookLM的错误大大减少了,尽管仍然不是完美的。结合我们的大模型使用经验,如果你的要求是准确无误地显示重要数字,那么,最好的办法还是回到原文出处,亲自比对检查。
