各位老师、同学们,大家下午好!我是来自中科院计算机网络信息中心的祝恒书。
今天能在这里和大家聊聊当前火热的人工智能大模型,我深感荣幸。为此,我还特意请女儿为今天的演讲起了个题目——《大模型来了,阁下又该如何应对?》
在开始之前,我想请大家思考一个问题:在您心中,人工智能应该是什么样子?
不用急着回答,希望大家带着这个问题聆听今天的演讲。我相信在最后,各位都会对这个问题有全新的理解。
那么接下来,就进入今天的演讲内容。
从单一到通用我想从最近我们全家都在玩的一款游戏说起。这款游戏叫《原神》,是国内一款出色的开放世界游戏,音乐也非常动听,其中还蕴含着许多富有哲思的内容。
在游戏的最新章节中,有个关键人物叫阿贝多,就是下图右边这位金发“少年”。

阿贝多是个什么样的人物呢?他是蒙德西风骑士团调查小队的队长,还是一位技艺精湛的炼金术师。除此之外,他还有一个不为人知的身份——他其实是一个人造人。
什么叫人造人?就是由人类亲手创造出来的人形生命。
这件事听起来十分奇幻。但实际上,用机器制造一个具有独立思考能力的人造人,是每一位人工智能研究者的终极梦想。
人工智能是什么?它的英文是"Artificial Intelligence",所以大家简称"AI"。从AI诞生到现在,它的定义一直在变化。我自己最喜欢的定义是:人工智能是人类创造的机器智能。关键在于让机器能像人一样,用智能的方式去思考和解决问题。然而,直接创造出像阿贝多这样能解决所有问题的人造人,目前仍是十分困难的事情。
人工智能科学家在过去的70年里做了大量工作,选择了逐步击破的方式。因此传统的人工智能,通常只是解决某一个领域的单一问题。比如说,科学家们制造出了可以切菜的机械臂;研制出了能够进行精密手术的机器人;甚至创作出能在舞台上扭秧歌、甩手帕的表演机器人;还有各种各样的自动驾驶、无人车……这些其实都是人工智能的体现。
但这些人工智能,通常只能解决某一个特定领域的问题。那么,让一个机器去解决通用领域的问题,这就是人工智能科学家一直所追求的梦想。
人工智能是在1956年的达特茅斯会议上提出的,距今已有近70年的历史了。我相信大家肯定也听过很多关于人工智能的讲座。那些老教授们经常会讲,这70年里发生了好几次浪潮、几次革命。
但遗憾的是,我是一个85后。在人工智能发展前30年,我还没有出生。因此对于前30年发生的事,我只能通过史料来了解。所以今天,我将重点分享我出生之后的这30年,人工智能领域发生的重大变化。
在我出生之后的这30年里,我觉得人工智能领域有三件非常值得铭记的大事。

第一件事,是1997年,IBM公司研发了一个超级计算机,叫深蓝。这台计算机在国际象棋上战胜了世界冠军卡斯帕罗夫。这件事在我小学的时候引起了很大轰动,甚至被写进了考试卷里。
为什么能引起这么大的轰动呢?因为国际象棋是一个公认的智力运动。以前大家觉得让机器在智力运动上战胜人类,几乎是不可想象的。但IBM通过超级计算机制造出的人工智能,战胜了人类的冠军,这无疑是非常了不起的成就。
第二件事发生在20年之后,也就是2016年,谷歌投资了一家英国公司——DeepMind。这家公司开发了一个叫AlphaGo的人工智能,它在围棋上战胜了当时的冠军李世石。后来,它的改进版本还战胜了中国的冠军柯洁。
AlphaGo的胜利在当时引起了巨大轰动,甚至开启了一个全新的深度学习时代。因为围棋的复杂程度非常高,空间复杂度高达10^360,这甚至超过了宇宙中原子的总数。所以大家一直认为,围棋作为人类智力运动的明珠,是绝对不可能被人工智能战胜的。最后,AI通过精心设计的算法,成功战胜了世界冠军。
第三件事,是2024年10月30日,美国一家名叫OpenAI的公司发布了一个生成式人工智能大模型,叫ChatGPT,它真正地开启了大模型时代。之后全球出现了百模大战,中国也出现了DeepSeek、豆包、文心一言、ChatGLM等大量模型,让我们看到了通用人工智能的曙光。
通用人工智能的曙光为什么说大模型是通用人工智能的真正曙光呢?我相信大家平时都用过大模型吧。首先,你可以用自然语言和它进行交互,问它各种问题。例如你可以请它帮你写一首藏头诗,并且指定诗句中需要嵌入特定文字,它都能轻松完成。
你还可以说,请用中学生能听懂的语言,解释一下什么是相对论,它也可以清晰地向你说明。
它甚至还能帮你画画。比如说,请帮我用中国水墨画的风格,为人工智能创作一幅宣传图。

于是我把这张图发给了大模型,大模型告诉我这是现在年轻人里流传的一个梗图。所以我顺手就把这张图加进了我的表情包里。现在女儿有时晚上会发:“天黑了怎么办?”我就给她回:“呵呵呵,自己吓自己。”
那么大模型除了可以用于问答以外,还可以做些什么呢?它还可以理解物理世界并创造虚拟世界,这个视频来自去年OpenAI发布的一个文生视频大模型Sora。
这个视频是什么意思呢?我输入一段文字描述,比如在东京街头,一位时尚的女性在行走。Sora就可以根据这段文字,直接生成一段很短的视频,并且视频质量相当高。从人工智能科学家的角度来看,这件事是具有里程碑意义的。大模型能够真正地理解人类所处的物理世界,并且能在此基础上进行内容的生成与创造。
来源:https://www.huxiu.com/article/4792882.html
