生成式AI时代大模型应用趋势_AI热点日报

自ChatGPT发布以来，全球AI投资超2000亿美元，大模型与AI应用爆发。AI具备快速普及与大幅提升生产力两大特征，ChatGPT用户突破1亿仅用2个月。海外大模型呈“一超多强”，国内“千模大战”，豆包、Kimi等月活近4000万。AI应用从人主导辅助走向自动化，精准与创造融合，现象级应用Remini爆火。

自2022年11月30日OpenAI发布ChatGPT以来，已经过去了17个月。这期间，为人工智能提供算力的NVIDIA，市值飙升超过340%；全球涌入AI领域的资金，累计超过2000亿美元；数千个大语言模型和数十万个AI应用，像雨后春笋般涌现。从科技界、企业界、投资界到各国政府，AI已经成了最热的话题。Meta的全球业务负责人Nicola Mendelsohn甚至将其称为“地震时刻”——人类科技界的一次大地震。而在我们的工作和生活中，不知不觉间，也已是“AI相伴”。

这篇文章，会从一个全新的视角，带大家重新认知和理解AI的内在逻辑、发展脉络与未来走向。

01 AI时代来了吗？如何来？

纵观历史，技术革命的力量从来都是不可阻挡的，它一次次推动着人类经济的飞跃和社会的变革。从18世纪的工业革命开始，差不多每隔一个甲子，世界就要迎来一次翻天覆地的变化。这不仅仅是时间的巧合，更是人类智慧与勇气的集中体现。

眼下，距离上世纪70年代由信息通信技术（ICT）和数字革命引领的信息时代，已经过去了半个多世纪。经验告诉我们，下一次科技革命也许就该来了。不过别忘了，就在这波AI爆火之前，科技界的新宠还是“元宇宙”。而现在，很多人已经把AI认定是人类科技的巨大进步，是一场名副其实的技术革命。那么问题来了：热度空前的AI，真的能被视为一次全新的技术革命吗？

回顾历史可以发现，任何一次技术革命都必须具备两个先决条件：一是技术的快速普及，二是生产力的大幅提升。

丨快速的技术普及

技术革命能够推动社会、经济和环境的进步，但这一切的前提，是技术的普及。普及意味着更多的应用场景、更多的商业价值、更多的用户、更多的社会认同，以及更低的技术成本和更密集的投资。

实际上，人工智能并不是一个新物种。长期以来，它一直在为我们的技术默默提供动力——比如增强智能手机的摄像头、改进搜索算法、处理海量数据等等。AI的科技发展史甚至可以追溯到上世纪60年代，当时麻省理工学院的约瑟夫·魏泽鲍姆（Joseph Weizenbaum）开发了伊莉莎（ELIZA），用于模拟与人类的有限对话。但直到OpenAI向全世界发布了更智能的生成式AI工具ChatGPT，真正的AI浪潮才被引爆，并深深嵌入公众的视野。

ChatGPT以智能对话机器人的方式问世，凭借令人惊叹的对话体验、极简的操作方式、广泛的应用场景，再加上手机和Web端都可免费使用，它在极短时间内突破了1亿用户。这个速度之快，超越了人类历史上任何一个科技时代的任何一款产品。下图中对比了各科技时代代表性产品突破1亿用户所用的时间，相比之下，ChatGPT几乎是光速级的普及。

各科技时代代表性产品突破1亿用户所用时间对比

有专家把ChatGPT的出现比作“iPhone时刻”，意思是它像智能手机一样，具备广泛进入人们日常工作和生活的潜力，能成为人类智能进化的必要工具。这个观点总体值得赞同，但需要补充一点：GenAI在短短不到两年内已经广泛渗透到人们的工作和生活中，虽然应用深度还有待开发，但就普及速度而言，它远远超过了iPhone。要知道，iPhone用了5年半才实现1亿用户，而ChatGPT只用了2个月。

可以大胆预测，对比人类历史上的各个科技时代，GenAI的普及速度将超越所有历史时期。对这种速度，我们最需要理解的一点是：AI时代如同风暴来袭，应当及时扬帆，乘风破浪。

丨大幅提升的生产力

GenAI与以往技术浪潮相比，另一个巨大的不同在于其超强的生产力。

首先，GenAI是一个运用数据训练和学习事物的计算机科学领域。它模拟人类大脑的学习过程，但效率更高。它可以在几秒钟内掌握一个专业领域的知识，而人类可能需要在大学里花费数年时间。它不需要像人类那样先学习基础知识，也无需经历漫长的学习曲线。学习对它而言，如同呼吸般自然和轻松。这正是GenAI展现的奇迹——它以超越人类想象的速度学习和成长。这种学习能力和效率，无疑为人类未来的学习和工作带来了无限可能。

其次，GenAI凭借强大的内容生成、智能辅助和自动化能力，可以极大地改善现有工作流程，释放人力资源，提高整体效率。与以往的计算机和互联网浪潮相比，GenAI带来的生产力提升将更全面、更快速，也更碘伏。未来10年，90%的工作可能都要经历碘伏性的变化。从初级岗位到高管，每个人都将在十年内面临工作岗位、类型和方式的变革。

每百万营业额对应的员工人数，可以作为技术驱动生产力提升的重要参考指标。从下图中可以看出，PC时代大幅降低了单位销售额对应的员工人数。虽然在移动互联网时代，这个数字变化不大，但可以预判的是，在GenAI时代，这个数字将被大幅降低。这也意味着，每个员工的单体生产力因为GenAI会被大幅提升，甚至催生出“超级个体”——一个员工可以同时高效高质量地完成多工种、多任务。当然，这也意味着“超级个体公司”会兴起。

每百万营业额对应的员工人数变化趋势

02 海外大模型“一超多强”，国内大模型“群雄并起”

大语言模型（LLM）是GenAI发展的关键驱动力。作为核心技术，大模型的创新突破直接决定了GenAI能力的上限和应用前景。

当前，大模型技术正呈现出前所未有的发展态势。模型规模和训练数据量不断扩大，训练算法日臻成熟，计算能力持续提升。这些因素叠加在一起，让大模型的性能快速跃升。大模型的突破不仅让GenAI的应用场景日益扩大，覆盖了文本创作、代码生成、分析咨询、设计绘画等多个领域，而且其性能优势也使GenAI系统在很多复杂认知任务上，取得了与人类水平相当的表现。

海外大语言模型的发展较为成熟，国内大语言模型也在不断发展和追赶。随着技术的不断进步，大语言模型的性能和应用场景将会不断提升和拓展。

丨海外大模型应用

海外大模型发展较早，大语言模型领域的竞争格局也逐渐形成。OpenAI、谷歌、Anthropic、Meta等科技巨头以及创业公司都在相互竞争，形成了“一超多强”的态势。海外大语言模型的应用十分广泛，在聊天机器人、智能客服、内容创作等诸多领域都得以运用，且在语音识别、文本生成、智能推荐系统等方面都取得了显著的进步。下图中对比了海外主要大模型应用的月活跃用户数，可以看出ChatGPT作为“一超”，具有明显领先的月活用户数量，突破了2亿。但值得注意的是，在过去6个月里，这个数字并没有显著变化。

海外主要大模型应用的月活跃用户数对比

2024年2月8日，谷歌宣布将旗下人工智能聊天机器人Bard正式更名为Gemini，与其大模型的名称保持一致，并推出了新的订阅计划，允许用户访问其“最强大模型”Gemini Ultra 1.0。受此推动，Gemini在2月突破了1亿月活，但之后有所回落。下图的统计中包含了Bard和Gemini的共同数据。

由Anthropic公司推出的Claude大模型应用，以更注重AI安全以及更高的性价比而著称。在2024年3月发布Claude 3之后，月活迎来了超过200%的增长，达到了千万量级。值得一提的是，Anthropic是一家由前OpenAI成员共同创立的AI初创公司，以关注AI伦理相关的安全而闻名。创始人包括姐弟Dario和Daniela，他们曾是OpenAI GPT-3项目不可或缺的一部分，后来因AI安全问题而分道扬镳，从而促成了Anthropic于2021年的成立。

丨中国大模型应用

中国AI大模型的发展极为迅速，常被比喻为“千模大战”——指的是当前国内众多企业和机构竞相研发和推出AI大模型的现象。这种现象说明了国内大模型开发的热度和活力。原因首先是政府对AI发展高度重视，将其提升为国家战略，并出台一系列政策措施来推动AI技术的研究与应用；其次，国内的头部大型科技公司，如字节跳动、阿里巴巴、百度等，都在积极投入AI大模型的研发，并推出了一系列具有自主知识产权的AI产品和解决方案；另外，国内的资本市场也将AI作为重要的投资领域。根据IDC最新发布的《全球人工智能和生成式人工智能支出指南》，中国在生成式人工智能方面的投资增长正在加速，五年复合增长率达到86.2%。同时，也有新生力量拔地而起，强势入局，比如Kimi。

下图为中国Top AI大模型在APP端的月活表现，可以看出整体增长明显，整体突破了千万月活。其中，由字节跳动发布的豆包发展迅速，拔得头筹；而新生力量Kimi一发布就强势崛起，快速突破千万月活。大模型应用在APP端的火热，说明GenAI在中国to C市场具有相当大的发展空间和潜力。

中国Top AI大模型在APP端的月活表现

大模型应用的两个主要产品形态是APP和Web。下图呈现了在两种产品形态下，国内Top大模型应用的表现。可以注意到，受新年和春节的“假期效应”影响，在此期间整体月活有所下降，但假期之后，整体实现了快速增长。豆包、Kimi和天工在春节后都呈现爆发式增长。

国内Top大模型应用在APP和Web端的月活表现

聚焦到2024年4月，文心一言超过5000万月活，占据榜首；豆包和Kimi发展强势，双双接近4000万月活量级；天工凭借2024年的快速增长，已几乎达到3000万量级。智谱清言、讯飞星火和通义则组成了“千万量级”的第二梯队。紫东太初大模型月活还在百万量级，但在医疗、法律、交通和内容审核等垂直专业领域，展现出了潜力和价值。

2024年4月国内Top大模型应用月活数据

豆包 vs. Kimi

过去的6个月里，豆包和Kimi无疑是大模型应用中的两个明星。两者都从不到千万月活，爆发式增长，现已接近4000万用户量级。

字节跳动作为“应用工厂”，在互联网时代已经积累了丰富的市场运作经验。豆包的推出，延续了字节跳动打造高质量用户体验的产品优势。同时，字节跳动利用其强大的营销能力，对豆包进行了有效推广。豆包在抖音、今日头条等字节跳动旗下平台上获得了大量曝光，并通过各种线上线下活动快速吸引用户。

Kimi则通过精准的市场定位和功能提供，以及非常有效的多种渠道营销及社区运营，快速吸引大量用户。2023年10月首发，4个月内突破千万月活，5个月突破3000万月活——Kimi的迅速爆发在国内市场是现象级的。

豆包和Kimi的月活用户增长对比

对比豆包和Kimi的月活用户组成可以发现，豆包在APP端优势明显。豆包APP作为移动应用推出较早，应用场景灵活，功能多元化，涵盖问答、搜索、购物、订票等日常生活所需，因此触达用户更广泛。而Kimi在Web端却有着更好的表现。强大的长文本处理能力是Kimi进入市场的核心卖点，以其长文本阅读、分析和概括的能力，以及联网搜索和自动生成功能，吸引了广泛的用户群体。Kimi的使用者主要包括学术科研人员、互联网从业者、程序员、自媒体与内容创作者、金融和咨询分析师、法律从业人员等。这些用户群体的共性是需要处理大量文档信息，而对于长文本应用，Web端的用户体验显然更好。

豆包和Kimi的用户组成对比

03 AI应用借势来袭，多场景百花绽放

如上图所示，我们可以把AI应用的发展放在一个平面坐标系中来呈现。一个维度呈现AI应用中人和AI的角色演化，另一个维度呈现AI应用类别的宏观划分。

丨AI应用的进化之路

AI应用的进化之路，经历了从“人主导+AI辅助”，到“AI agent主导+人辅助”，再到“AI自动化”三个阶段。

第一阶段：人主导+AI辅助。在这个阶段，AI应用主要扮演辅助人类决策的角色。例如，在内容制作中，人需要清楚地描述需求，并给予对应的清晰指令和内容输入，而AI的角色是基于人的输入来完成撰写、改写或优化。再比如，在医疗诊断中，AI可以帮助医生分析医学影像数据，提高诊断的准确性。在这个阶段，人类仍然是决策的主导者，AI为其提供智能化的辅助。

第二阶段：AI agent主导+人辅助。在这个阶段，AI agent开始能够自主做出决策，但仍然需要人类的监督和辅助。例如，在自动驾驶汽车中，AI agent可以控制车辆的运动，但人类驾驶员仍然需要随时准备接管车辆。在这个阶段，AI agent的自主性有所提高，但人类仍然是决策过程中的重要参与者。

第三阶段：AI自动化。在这个阶段，AI agent能够完全自主地做出决策和执行任务，而无需人类的干预。例如，在一些工厂中，AI机器人可以完成所有的生产任务，而无需人类工人的操作。在这个阶段，AI agent已经完全实现了自动化，人类的角色被降到了最低限度。

AI应用进化之路的意义，在于它反映了AI技术不断发展的趋势。随着AI技术的不断进步，AI agent的自主性和决策能力将不断提高，最终将能够实现完全的自动化。这将对人类社会产生深远的影响，并带来许多新的机遇和挑战。

丨精准度和创造性

在AI应用中，分类可依据两个重要维度：精准度与创造性。精准度指的是AI应用精确完成任务的能力。在编程、教育、医疗、金融这类需要高度可靠的场景中，高精准度的AI应用便能大显身手。

创造性则代表着AI应用产生新颖、原创内容的能力。在艺术创作、科学研究等需要创新与想象力的场景中，高创造性的AI应用作用显著。例如，在艺术创作中，AI能够创作音乐、绘画、诗歌等艺术作品，创作出具有独特风格的音乐或有艺术价值的绘画；在文案创作方面，它可以生成广告文案、营销文案等，提升文案的创意与吸引力——比如根据目标受众特点，生成个性化的广告文案。

随着AI技术的不断发展，精准型AI应用和创造型AI应用都将取得更大的进步。在未来，AI应用将突破单一维度的限制，实现精准与创造的深度融合，在各个领域发挥更大的效能。

丨现象级AI应用：Remini

Remini应用界面截图

在众多的AI应用中，Remini最近的爆火使其成为“星中之星”，非常值得关注。Remini是一款由大觥科技（一家中国公司）最初开发，后来被意大利公司Bending Spoons收购的AI图像编辑软件。

它以AI技术为核心，提供多种创新的图像处理功能，包括老照片修复、画质增强、AI风格化以及黏土滤镜等。Remini因其独特的AI滤镜效果，尤其是在社交媒体上流行的黏土滤镜风格，迅速走红并吸引了大量用户。

Remini生成的图片，并不是在原图加一层滤镜那么简单。它会对照片中人物的表情、背景、衣着进行创作，而且每次生成的效果都不同。这种“盲盒效应”让用户对其欲罢不能。

Remini 2019年便进入海外市场，并表现出色，年收益达上亿美金。而在中国市场一直没有过多推广。直到今年的五一假期期间，Remini的特效图从五一前就开始在抖音和小红书上被用户自发传播，迅速火遍全网，同时登上苹果中国区Appstore免费榜的榜首。通过上图可以看到，4月29日开始，Remini在抖音的声量和互动量飙升，并在整个五一假期期间持续。同时，其日活跃用户规模也对应快速增长，突破了千万日活。

Remini在抖音的声量及日活跃用户变化

丨AI教育应用的出海双骄

中国AI应用走出国门已经是大势所趋。在AI教育应用领域，字节跳动和作业帮都推出了各自的产品——Gauth和Question AI，并在海外取得了巨大的成功。2024年4月，Gauth和Question AI占据了美国iOS教育类下载榜单的第二和第三位，排名仅次于多邻国。两款应用均利用AI技术为数学、化学、生物、物理等多学科问题提供分步解题方法，支持多种解题方法，学生可以根据自己的理解选择最适合的解法，同时拥有庞大的试题库。

在APP端，这两个AI应用进入2024年之后，月活规模都实现了爆发式增长。Gauth在一月份还不足百万月活，到三月份已经突破400万月活。Question AI在4月份已经接近500万月活。

Gauth和Question AI的月活增长趋势

通过下图的数据可以注意到，Gauth在Web端的应用更广泛，而Question AI在APP端更强势。这个差别来自于两个产品的定位差异。Gauth以网站应用为主，这更符合传统的学习场景——通常是在电脑前进行，因此Web端应用能够更好地符合用户的使用习惯。而Question AI更注重APP端的应用，目的是提供更加便捷和即时的学习体验，学生可以随时随地使用手机或平板电脑进行学习和解题，并通过手机实现拍照搜题和语音问答等功能。同时，Question AI采用AI Chatbot对话问答的交互模式，因此在手机端的应用体验也更好。目前Gauth月活已经突破900万量级，实现千万量级月活指日可待。

Gauth和Question AI在Web端和APP端的月活对比

丨AI应用的趋势研究

AI应用已经呈现出蓬勃发展的态势，各类AI应用层出不穷。然而，不同类型的AI应用在市场上的需求程度趋势却各有不同。通过AI应用相关热词在社媒的声量表现，我们可以注意到：

AI文本编辑类应用火热异常。这类应用利用GenAI技术，可以自动生成文本、翻译语言、校对语法、优化文风等，帮助用户提高写作效率和质量。在工作中，写作场景比较高频，且对于许多缺乏写作技巧或时间精力有限的人，AI辅助写作可以大幅提升效率和质量。因此，人们对文本编辑类AI应用的需求越来越大，依赖也越来越强。

AI视频剪辑类应用逐渐降温。与AI文本编辑类应用相比，AI视频剪辑类应用的技术成熟度相对较低。在一些功能方面，例如视频识别、剪辑和特效添加等，AI视频剪辑类应用的准确性和效率还有待提高。这导致部分用户在使用AI视频剪辑类应用时，无法获得理想的效果，从而降低了用户的满意度和使用率。但随着AI技术和能力的持续发展，AI视频编辑依然会是非常重要的AI应用场景。

网站分析类AI应用需求持续增长。网站分析类AI应用可以应用于各种类型的网站，为网站运营者提供全面的网站分析数据和洞察。这包括帮助企业深入理解用户行为、优化网站设计、提升用户体验，从而促进业务增长；以及分析用户偏好和行为模式，为用户定制个性化内容和服务，增强用户粘性，帮助提高网站流量、转化率和用户留存率。其应用对象包括电商类的品牌独立站、内容型网站、新闻网站、社媒网站和教育类网站等。

AI应用相关热词在社媒的声量表现

04 结语：AI时代，欢迎你的到来

我们正在进入一个全新的技术革命时代：AI时代。它以不曾有过的普及速度和超强生产力的创造能力驰掣而来，而点燃这一切的，便是GenAI的问世。大模型技术正日新月异地变化，海外和国内的大模型格局正逐渐形成。AI应用如在大模型中开出的朵朵鲜花，将人类逐渐推向智能时代，并创造了巨大的商业机会和空间。在AI应用领域，中国企业启动迅敏，发展疾驰，在中国和海外市场都盛开花朵。AI应用的发展趋势，更指向AI技术相对成熟、应用场景高频、需求满足度较高，且能带来直接价值的领域。

或许我们很幸运，与AI时代不期而遇。那样的迅速，那样的震撼，那样的望无止境……

- The end