自2022年11月30日OpenAI发布ChatGPT以来,已经过去了17个月。这期间,为人工智能提供算力的NVIDIA,市值飙升超过340%;全球涌入AI领域的资金,累计超过2000亿美元;数千个大语言模型和数十万个AI应用,像雨后春笋般涌现。从科技界、企业界、投资界到各国政府,AI已经成了最热的话题。Meta的全球业务负责人Nicola Mendelsohn甚至将其称为“地震时刻”——人类科技界的一次大地震。而在我们的工作和生活中,不知不觉间,也已是“AI相伴”。
这篇文章,会从一个全新的视角,带大家重新认知和理解AI的内在逻辑、发展脉络与未来走向。
01 AI时代来了吗?如何来?
纵观历史,技术革命的力量从来都是不可阻挡的,它一次次推动着人类经济的飞跃和社会的变革。从18世纪的工业革命开始,差不多每隔一个甲子,世界就要迎来一次翻天覆地的变化。这不仅仅是时间的巧合,更是人类智慧与勇气的集中体现。
眼下,距离上世纪70年代由信息通信技术(ICT)和数字革命引领的信息时代,已经过去了半个多世纪。经验告诉我们,下一次科技革命也许就该来了。不过别忘了,就在这波AI爆火之前,科技界的新宠还是“元宇宙”。而现在,很多人已经把AI认定是人类科技的巨大进步,是一场名副其实的技术革命。那么问题来了:热度空前的AI,真的能被视为一次全新的技术革命吗?
回顾历史可以发现,任何一次技术革命都必须具备两个先决条件:一是技术的快速普及,二是生产力的大幅提升。
丨快速的技术普及
技术革命能够推动社会、经济和环境的进步,但这一切的前提,是技术的普及。普及意味着更多的应用场景、更多的商业价值、更多的用户、更多的社会认同,以及更低的技术成本和更密集的投资。
实际上,人工智能并不是一个新物种。长期以来,它一直在为我们的技术默默提供动力——比如增强智能手机的摄像头、改进搜索算法、处理海量数据等等。AI的科技发展史甚至可以追溯到上世纪60年代,当时麻省理工学院的约瑟夫·魏泽鲍姆(Joseph Weizenbaum)开发了伊莉莎(ELIZA),用于模拟与人类的有限对话。但直到OpenAI向全世界发布了更智能的生成式AI工具ChatGPT,真正的AI浪潮才被引爆,并深深嵌入公众的视野。
ChatGPT以智能对话机器人的方式问世,凭借令人惊叹的对话体验、极简的操作方式、广泛的应用场景,再加上手机和Web端都可免费使用,它在极短时间内突破了1亿用户。这个速度之快,超越了人类历史上任何一个科技时代的任何一款产品。下图中对比了各科技时代代表性产品突破1亿用户所用的时间,相比之下,ChatGPT几乎是光速级的普及。

有专家把ChatGPT的出现比作“iPhone时刻”,意思是它像智能手机一样,具备广泛进入人们日常工作和生活的潜力,能成为人类智能进化的必要工具。这个观点总体值得赞同,但需要补充一点:GenAI在短短不到两年内已经广泛渗透到人们的工作和生活中,虽然应用深度还有待开发,但就普及速度而言,它远远超过了iPhone。要知道,iPhone用了5年半才实现1亿用户,而ChatGPT只用了2个月。
可以大胆预测,对比人类历史上的各个科技时代,GenAI的普及速度将超越所有历史时期。对这种速度,我们最需要理解的一点是:AI时代如同风暴来袭,应当及时扬帆,乘风破浪。
丨大幅提升的生产力
GenAI与以往技术浪潮相比,另一个巨大的不同在于其超强的生产力。
首先,GenAI是一个运用数据训练和学习事物的计算机科学领域。它模拟人类大脑的学习过程,但效率更高。它可以在几秒钟内掌握一个专业领域的知识,而人类可能需要在大学里花费数年时间。它不需要像人类那样先学习基础知识,也无需经历漫长的学习曲线。学习对它而言,如同呼吸般自然和轻松。这正是GenAI展现的奇迹——它以超越人类想象的速度学习和成长。这种学习能力和效率,无疑为人类未来的学习和工作带来了无限可能。
其次,GenAI凭借强大的内容生成、智能辅助和自动化能力,可以极大地改善现有工作流程,释放人力资源,提高整体效率。与以往的计算机和互联网浪潮相比,GenAI带来的生产力提升将更全面、更快速,也更碘伏。未来10年,90%的工作可能都要经历碘伏性的变化。从初级岗位到高管,每个人都将在十年内面临工作岗位、类型和方式的变革。
每百万营业额对应的员工人数,可以作为技术驱动生产力提升的重要参考指标。从下图中可以看出,PC时代大幅降低了单位销售额对应的员工人数。虽然在移动互联网时代,这个数字变化不大,但可以预判的是,在GenAI时代,这个数字将被大幅降低。这也意味着,每个员工的单体生产力因为GenAI会被大幅提升,甚至催生出“超级个体”——一个员工可以同时高效高质量地完成多工种、多任务。当然,这也意味着“超级个体公司”会兴起。

02 海外大模型“一超多强”,国内大模型“群雄并起”
大语言模型(LLM)是GenAI发展的关键驱动力。作为核心技术,大模型的创新突破直接决定了GenAI能力的上限和应用前景。
当前,大模型技术正呈现出前所未有的发展态势。模型规模和训练数据量不断扩大,训练算法日臻成熟,计算能力持续提升。这些因素叠加在一起,让大模型的性能快速跃升。大模型的突破不仅让GenAI的应用场景日益扩大,覆盖了文本创作、代码生成、分析咨询、设计绘画等多个领域,而且其性能优势也使GenAI系统在很多复杂认知任务上,取得了与人类水平相当的表现。
海外大语言模型的发展较为成熟,国内大语言模型也在不断发展和追赶。随着技术的不断进步,大语言模型的性能和应用场景将会不断提升和拓展。
丨海外大模型应用
海外大模型发展较早,大语言模型领域的竞争格局也逐渐形成。OpenAI、谷歌、Anthropic、Meta等科技巨头以及创业公司都在相互竞争,形成了“一超多强”的态势。海外大语言模型的应用十分广泛,在聊天机器人、智能客服、内容创作等诸多领域都得以运用,且在语音识别、文本生成、智能推荐系统等方面都取得了显著的进步。下图中对比了海外主要大模型应用的月活跃用户数,可以看出ChatGPT作为“一超”,具有明显领先的月活用户数量,突破了2亿。但值得注意的是,在过去6个月里,这个数字并没有显著变化。

2024年2月8日,谷歌宣布将旗下人工智能聊天机器人Bard正式更名为Gemini,与其大模型的名称保持一致,并推出了新的订阅计划,允许用户访问其“最强大模型”Gemini Ultra 1.0。受此推动,Gemini在2月突破了1亿月活,但之后有所回落。下图的统计中包含了Bard和Gemini的共同数据。
由Anthropic公司推出的Claude大模型应用,以更注重AI安全以及更高的性价比而著称。在2024年3月发布Claude 3之后,月活迎来了超过200%的增长,达到了千万量级。值得一提的是,Anthropic是一家由前OpenAI成员共同创立的AI初创公司,以关注AI伦理相关的安全而闻名。创始人包括姐弟Dario和Daniela,他们曾是OpenAI GPT-3项目不可或缺的一部分,后来因AI安全问题而分道扬镳,从而促成了Anthropic于2021年的成立。
丨中国大模型应用
中国AI大模型的发展极为迅速,常被比喻为“千模大战”——指的是当前国内众多企业和机构竞相研发和推出AI大模型的现象。这种现象说明了国内大模型开发的热度和活力。原因首先是政府对AI发展高度重视,将其提升为国家战略,并出台一系列政策措施来推动AI技术的研究与应用;其次,国内的头部大型科技公司,如字节跳动、阿里巴巴、百度等,都在积极投入AI大模型的研发,并推出了一系列具有自主知识产权的AI产品和解决方案;另外,国内的资本市场也将AI作为重要的投资领域。根据IDC最新发布的《全球人工智能和生成式人工智能支出指南》,中国在生成式人工智能方面的投资增长正在加速,五年复合增长率达到86.2%。同时,也有新生力量拔地而起,强势入局,比如Kimi。
下图为中国Top AI大模型在APP端的月活表现,可以看出整体增长明显,整体突破了千万月活。其中,由字节跳动发布的豆包发展迅速,拔得头筹;而新生力量Kimi一发布就强势崛起,快速突破千万月活。大模型应用在APP端的火热,说明GenAI在中国to C市场具有相当大的发展空间和潜力。

大模型应用的两个主要产品形态是APP和Web。下图呈现了在两种产品形态下,国内Top大模型应用的表现。可以注意到,受新年和春节的“假期效应”影响,在此期间整体月活有所下降,但假期之后,整体实现了快速增长。豆包、Kimi和天工在春节后都呈现爆发式增长。

聚焦到2024年4月,文心一言超过5000万月活,占据榜首;豆包和Kimi发展强势,双双接近4000万月活量级;天工凭借2024年的快速增长,已几乎达到3000万量级。智谱清言、讯飞星火和通义则组成了“千万量级”的第二梯队。紫东太初大模型月活还在百万量级,但在医疗、法律、交通和内容审核等垂直专业领域,展现出了潜力和价值。

豆包 vs. Kimi
过去的6个月里,豆包和Kimi无疑是大模型应用中的两个明星。两者都从不到千万月活,爆发式增长,现已接近4000万用户量级。
字节跳动作为“应用工厂”,在互联网时代已经积累了丰富的市场运作经验。豆包的推出,延续了字节跳动打造高质量用户体验的产品优势。同时,字节跳动利用其强大的营销能力,对豆包进行了有效推广。豆包在抖音、今日头条等字节跳动旗下平台上获得了大量曝光,并通过各种线上线下活动快速吸引用户。
Kimi则通过精准的市场定位和功能提供,以及非常有效的多种渠道营销及社区运营,快速吸引大量用户。2023年10月首发,4个月内突破千万月活,5个月突破3000万月活——Kimi的迅速爆发在国内市场是现象级的。

对比豆包和Kimi的月活用户组成可以发现,豆包在APP端优势明显。豆包APP作为移动应用推出较早,应用场景灵活,功能多元化,涵盖问答、搜索、购物、订票等日常生活所需,因此触达用户更广泛。而Kimi在Web端却有着更好的表现。强大的长文本处理能力是Kimi进入市场的核心卖点,以其长文本阅读、分析和概括的能力,以及联网搜索和自动生成功能,吸引了广泛的用户群体。Kimi的使用者主要包括学术科研人员、互联网从业者、程序员、自媒体与内容创作者、金融和咨询分析师、法律从业人员等。这些用户群体的共性是需要处理大量文档信息,而对于长文本应用,Web端的用户体验显然更好。

03 AI应用借势来袭,多场景百花绽放
如上图所示,我们可以把AI应用的发展放在一个平面坐标系中来呈现。一个维度呈现AI应用中人和AI的角色演化,另一个维度呈现AI应用类别的宏观划分。
丨AI应用的进化之路
AI应用的进化之路,经历了从“人主导+AI辅助”,到“AI agent主导+人辅助”,再到“AI自动化”三个阶段。
第一阶段:人主导+AI辅助。在这个阶段,AI应用主要扮演辅助人类决策的角色。例如,在内容制作中,人需要清楚地描述需求,并给予对应的清晰指令和内容输入,而AI的角色是基于人的输入来完成撰写、改写或优化。再比如,在医疗诊断中,AI可以帮助医生分析医学影像数据,提高诊断的准确性。在这个阶段,人类仍然是决策的主导者,AI为其提供智能化的辅助。
第二阶段:AI agent主导+人辅助。在这个阶段,AI agent开始能够自主做出决策,但仍然需要人类的监督和辅助。例如,在自动驾驶汽车中,AI agent可以控制车辆的运动,但人类驾驶员仍然需要随时准备接管车辆。在这个阶段,AI agent的自主性有所提高,但人类仍然是决策过程中的重要参与者。
第三阶段:AI自动化。在这个阶段,AI agent能够完全自主地做出决策和执行任务,而无需人类的干预。例如,在一些工厂中,AI机器人可以完成所有的生产任务,而无需人类工人的操作。在这个阶段,AI agent已经完全实现了自动化,人类的角色被降到了最低限度。
AI应用进化之路的意义,在于它反映了AI技术不断发展的趋势。随着AI技术的不断进步,AI agent的自主性和决策能力将不断提高,最终将能够实现完全的自动化。这将对人类社会产生深远的影响,并带来许多新的机遇和挑战。
丨精准度和创造性
在AI应用中,分类可依据两个重要维度:精准度与创造性。精准度指的是AI应用精确完成任务的能力。在编程、教育、医疗、金融这类需要高度可靠的场景中,高精准度的AI应用便能大显身手。
创造性则代表着AI应用产生新颖、原创内容的能力。在艺术创作、科学研究等需要创新与想象力的场景中,高创造性的AI应用作用显著。例如,在艺术创作中,AI能够创作音乐、绘画、诗歌等艺术作品,创作出具有独特风格的音乐或有艺术价值的绘画;在文案创作方面,它可以生成广告文案、营销文案等,提升文案的创意与吸引力——比如根据目标受众特点,生成个性化的广告文案。
随着AI技术的不断发展,精准型AI应用和创造型AI应用都将取得更大的进步。在未来,AI应用将突破单一维度的限制,实现精准与创造的深度融合,在各个领域发挥更大的效能。
丨现象级AI应用:Remini

在众多的AI应用中,Remini最近的爆火使其成为“星中之星”,非常值得关注。Remini是一款由大觥科技(一家中国公司)最初开发,后来被意大利公司Bending Spoons收购的AI图像编辑软件。
它以AI技术为核心,提供多种创新的图像处理功能,包括老照片修复、画质增强、AI风格化以及黏土滤镜等。Remini因其独特的AI滤镜效果,尤其是在社交媒体上流行的黏土滤镜风格,迅速走红并吸引了大量用户。
Remini生成的图片,并不是在原图加一层滤镜那么简单。它会对照片中人物的表情、背景、衣着进行创作,而且每次生成的效果都不同。这种“盲盒效应”让用户对其欲罢不能。
Remini 2019年便进入海外市场,并表现出色,年收益达上亿美金。而在中国市场一直没有过多推广。直到今年的五一假期期间,Remini的特效图从五一前就开始在抖音和小红书上被用户自发传播,迅速火遍全网,同时登上苹果中国区Appstore免费榜的榜首。通过上图可以看到,4月29日开始,Remini在抖音的声量和互动量飙升,并在整个五一假期期间持续。同时,其日活跃用户规模也对应快速增长,突破了千万日活。

丨AI教育应用的出海双骄
中国AI应用走出国门已经是大势所趋。在AI教育应用领域,字节跳动和作业帮都推出了各自的产品——Gauth和Question AI,并在海外取得了巨大的成功。2024年4月,Gauth和Question AI占据了美国iOS教育类下载榜单的第二和第三位,排名仅次于多邻国。两款应用均利用AI技术为数学、化学、生物、物理等多学科问题提供分步解题方法,支持多种解题方法,学生可以根据自己的理解选择最适合的解法,同时拥有庞大的试题库。
在APP端,这两个AI应用进入2024年之后,月活规模都实现了爆发式增长。Gauth在一月份还不足百万月活,到三月份已经突破400万月活。Question AI在4月份已经接近500万月活。

通过下图的数据可以注意到,Gauth在Web端的应用更广泛,而Question AI在APP端更强势。这个差别来自于两个产品的定位差异。Gauth以网站应用为主,这更符合传统的学习场景——通常是在电脑前进行,因此Web端应用能够更好地符合用户的使用习惯。而Question AI更注重APP端的应用,目的是提供更加便捷和即时的学习体验,学生可以随时随地使用手机或平板电脑进行学习和解题,并通过手机实现拍照搜题和语音问答等功能。同时,Question AI采用AI Chatbot对话问答的交互模式,因此在手机端的应用体验也更好。目前Gauth月活已经突破900万量级,实现千万量级月活指日可待。

丨AI应用的趋势研究
AI应用已经呈现出蓬勃发展的态势,各类AI应用层出不穷。然而,不同类型的AI应用在市场上的需求程度趋势却各有不同。通过AI应用相关热词在社媒的声量表现,我们可以注意到:
AI文本编辑类应用火热异常。这类应用利用GenAI技术,可以自动生成文本、翻译语言、校对语法、优化文风等,帮助用户提高写作效率和质量。在工作中,写作场景比较高频,且对于许多缺乏写作技巧或时间精力有限的人,AI辅助写作可以大幅提升效率和质量。因此,人们对文本编辑类AI应用的需求越来越大,依赖也越来越强。
AI视频剪辑类应用逐渐降温。与AI文本编辑类应用相比,AI视频剪辑类应用的技术成熟度相对较低。在一些功能方面,例如视频识别、剪辑和特效添加等,AI视频剪辑类应用的准确性和效率还有待提高。这导致部分用户在使用AI视频剪辑类应用时,无法获得理想的效果,从而降低了用户的满意度和使用率。但随着AI技术和能力的持续发展,AI视频编辑依然会是非常重要的AI应用场景。
网站分析类AI应用需求持续增长。网站分析类AI应用可以应用于各种类型的网站,为网站运营者提供全面的网站分析数据和洞察。这包括帮助企业深入理解用户行为、优化网站设计、提升用户体验,从而促进业务增长;以及分析用户偏好和行为模式,为用户定制个性化内容和服务,增强用户粘性,帮助提高网站流量、转化率和用户留存率。其应用对象包括电商类的品牌独立站、内容型网站、新闻网站、社媒网站和教育类网站等。

04 结语:AI时代,欢迎你的到来
我们正在进入一个全新的技术革命时代:AI时代。它以不曾有过的普及速度和超强生产力的创造能力驰掣而来,而点燃这一切的,便是GenAI的问世。大模型技术正日新月异地变化,海外和国内的大模型格局正逐渐形成。AI应用如在大模型中开出的朵朵鲜花,将人类逐渐推向智能时代,并创造了巨大的商业机会和空间。在AI应用领域,中国企业启动迅敏,发展疾驰,在中国和海外市场都盛开花朵。AI应用的发展趋势,更指向AI技术相对成熟、应用场景高频、需求满足度较高,且能带来直接价值的领域。
或许我们很幸运,与AI时代不期而遇。那样的迅速,那样的震撼,那样的望无止境……
- The end
