首页 游戏 软件 资讯 排行榜 专题
首页
AI
对话APUS李涛揭秘AI转型大模型蒸馏训练与中小模型沉淀

对话APUS李涛揭秘AI转型大模型蒸馏训练与中小模型沉淀

热心网友
29
转载
2026-05-15

走进融新科技中心A座23层,绿植与野营桌椅帐篷构成了一幅轻松的画面。在这里,我们见到了APUS创始人李涛,一身休闲装,神态放松。访谈还没开始,他就用八个字概括了创办APUS的心路——“享受过程、追求快乐”。整个对话中,“快乐”一词被反复提及。令人印象深刻的是,关于创业压力与至暗时刻的抱怨很少,取而代之的,是一种应对行业变局的从容。

据说,APUS选择办公地点时偏爱高层。原因很简单:狭窄的格子间容易带来压迫感,而开阔的视野能让团队心境更宽广。站在他们办公室的窗前,北京的地标建筑“中国尊”清晰可见。

李涛是国内最早一批接触大模型的业内人士。早在2019年,他就与字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷会见了OpenAI创始人Sam Altman。这次会面,为APUS日后全面转向人工智能埋下了伏笔。

2022年11月底,ChatGPT的横空出世引爆了全球关注。随后,谷歌宣布推出Bard,微软则将大型语言模型深度整合进Office套件。国际科技巨头在大模型领域的角逐,至今仍未停歇。

国内市场同样风起云涌。今年2月ChatGPT在国内出圈后,互联网大厂迅速入场。百度率先官宣“文心一言”,阿里、腾讯、360等也相继加入战局。虽然一些厂商尚未推出可商用的产品,但大部分都已将重心转向大模型研发。

在这场全球性的AI竞赛中,APUS的布局显得更早一些。这家成立于2014年的全球化移动互联网公司,以工具产品起家,逐步拓展至内容与服务,目前全球用户已超24亿。面对AI风口,APUS在2019年便开始相关探索,并于去年底正式启动“大AI战略”,比国内这波热潮早了近两个月。

从移动互联网公司转向人工智能,李涛认为这与公司的定位转变密不可分。“2020年以前,我们定位自己是‘中国出海企业’;之后,我们升级为‘全球化公司’。这个定位决定了我们能更早感知到全球技术浪潮的变化。去年底,我们真切感受到了AI带来的竞争压力与巨大潜力,于是决定全面拥抱AI。”

一、“不要抱着补偿心理创业,创业者要享受过程”

问:您如何看待创业这件事?

李涛:创业是一个动态过程,它既不是起点,也不是终点。创业者必然会经历高光与低谷。如果只盯着三五年后的某个成功时刻,那么高光过后,落寞感也会随之而来,这是自然规律。所以,创业者不必为了追求某个特定时刻而苦苦煎熬,更重要的是享受整个过程,从中获得快乐。

问:所以您属于很享受过程的人?

李涛:是的。做事首先要顺势而为,其次要学会造势,最后是享受过程。把这三件事都做到,心态自然会平衡,成功之后也不会有强烈的“补偿心理”——觉得过去太苦了,现在必须加倍索取。

问:要想创业成功,什么特质最重要?

李涛:积极且稳定的心态。市场上有些上市公司并不赚钱,部分原因就在于创始人觉得创业过程太苦,上市后补偿心理过重,这种心态反而会阻碍企业走向真正的成功。相反,那些能持续处在高光期的企业,其领导者往往是在享受创造价值的过程,并非单纯追求某个里程碑。这种积极心态,会带来正向的循环效应。

创办APUS以来,业务增长很快,因为创造了社会价值,我也从中感受到快乐。没有补偿心理的负担,反而更容易做出清醒的判断,让企业保持健康的发展态势。

二、全球化视野提前感知AI变革,决定全面转型

问:APUS如何定位自己?

李涛:我们是一家以产品技术为核心的全球化移动互联网公司。2014到2019年,我们专注于出海业务,定位是“中国出海企业”。2019年战略升级后,我们将自己定位为“全球化公司”,中国、美国或其他市场,都只是我们选择的区域市场之一。

问:决定全面转型人工智能,有什么具体的契机吗?

李涛:ChatGPT的出现,再次暴露了国内互联网全球化程度不足的问题。其实去年10月,ChatGPT就在美国校园火了,但这个概念直到今年2月才在国内形成热潮。这意味着,国内在技术意识的感知上,可能比美国晚了三到四个月。而作为一家全球化企业,APUS的感知模型天然具备全球视野,我们去年就已经接触到ChatGPT并开始了相关研究。

问:APUS最早是如何切入的?

李涛:我们从AIGC入手。但很快发现,ChatGPT所代表的语言模型训练,其挑战远大于AIGC。如今很多所谓的AIGC,其实只能算中等模型,并非真正的大模型。

问:所以像谷歌这样拥有海量数据的公司,在大模型上最有优势?

李涛:未必。这类公司往往面临“自我革命”的难题。搜索引擎建立在归纳法之上,并由此形成了成熟的商业模式。让它们彻底转向演绎法逻辑的大模型,非常困难。谷歌做大模型多少有些被动,因为已经落后,就只能遵循OpenAI制定的规则。即便未来谷歌做出了超越OpenAI的模型,它很可能也会试图将技术拉回自己熟悉的赛道,以发挥原有优势,这反而可能导致再次落后。这是巨头们的普遍痛点。

问:如果中国出现下一个OpenAI,您认为小公司比大公司的机会更大?

李涛:对。目前有能力尝试GPT的,大多是互联网企业,但它们往往有沉重的既得利益包袱,不愿轻易舍弃。因此,像王慧文这样宣布投入5000万美金的新势力,反而更值得期待。

问:为什么值得期待?能做成吗?

李涛:所有试图投身AI大模型的中国企业都值得期待。王慧文的价值在于,他在大多数人还在观望时就率先表态。当然,表态只是第一步,最终能交出什么样的产品,还需要观察。

问:有大量资金投入,是否意味着我们离大模型更近了?

李涛:大模型靠的是什么?第一是场景,第二是数据,第三是算法,第四是算力。这不仅仅是砸钱就能解决的。

客观来看,我们的场景很丰富;数据量虽不小,但在全球范围内并无绝对优势;算法则处于割裂状态,缺乏一个开放平台来整合大家的智慧;算力方面,我们正面临高性能芯片的限制,与美国相比仍有差距。

总结起来就是:场景丰富,数据中等,算法分散,算力不足。

问:这些问题该如何解决?

李涛:一方面,中国大量算力掌握在政府和运营商手中,需要政府层面推动算力资源的整合。另一方面,行业也需要推动算法公开。

问:为什么倡导公开算法?

李涛:大模型因涉及商业核心,不公开是合理的。但算法可以公开。只有算法公开,才能汇聚众人的智慧。代码开放意味着有更多人能参与维护和优化,从而快速提升整体水平。这本质上是一种利己行为。OpenAI就很聪明,它做完基础模型后,把接口开放了出来。模型训练需要海量数据和多样场景,这不是关起门来就能完成的。

从另一个角度看,算法公开能激励更多开发者创新,推动行业进步,营造更好的发展氛围。开源利人利己,何乐而不为?

问:如果这些问题得到解决,中国企业有机会吗?

李涛:有机会,但不会一蹴而就。这场AI竞赛的本质,首先是看谁能率先抓住应用场景;其次是数据;第三是国际化能力。只有足够国际化,才能解决算法持续迭代和算力不足的问题。

三、用蒸馏法训练AI大模型,沉淀中小模型

问:APUS今年在AI大模型方面的目标是什么?

李涛:目标非常明确:全面拥抱AI,成为一家人工智能公司。我们预估,转型后公司业绩有望实现200%的增长。

问:成为人工智能公司的标志是什么?

李涛:主要有四个维度:第一,企业内部生产工具和生产效率因AI得到实质性提升;第二,用AI改造现有全部产品;第三,在AI环境下探索全新的产品形态;第四,将AI能力推向全产业链,使其成为新的增长引擎。

问:会与百度“文心一言”这样的大模型公司合作吗?

李涛:合作或许会有,但存在一个关键矛盾:合作沉淀下来的模型资产归属谁?这个关系很难平衡。因此,国内企业都需要考虑沉淀出属于自己的中小模型,这是未来发展的基石。

问:具体应该怎么做?

李涛:方法包括:利用外部大模型进行自我训练;同时,通过“蒸馏法”用领先的大模型(如GPT)来反向训练自己的模型;在关键节点,还需要加入人工干预。

问:APUS在自己训练大模型吗?

李涛:我们自研了一个参数在千亿级别的“天燕”大模型,并由此衍生出无数精炼的中小模型。同时,我们也用GPT等大模型,通过蒸馏法来训练我们自己的模型。

从商业化角度看,我们会针对不同场景部署不同的小模型。每个场景可能对应1到10款不同的产品或软件,以此确保有足够的用户量来持续优化我们的小模型。

问:中小模型和大模型的核心区别是什么?

李涛:区别主要在于参数规模、所需算力和应用场景。大模型与中小模型界限分明,而中小模型之间则比较模糊。大模型能力全面,可以封装出中模型和小模型。未来,独立存在的小模型可能会很少,它们大多会是在大模型训练过程中,针对特定参数和场景衍生出来的。

问:大、中、小模型,哪个会率先爆发或带来更多商业机会?

李涛:毋庸置疑,短期内一定是中小模型。今年下半年,各种中小模型会迅速产生商业价值。但从长远看,潜力最大的依然是大模型。如果说PC时代的引擎是Windows和Linux,移动互联网时代的引擎是安卓和iOS,那么下一个时代的引擎就是人工智能。OpenAI的野心,正是想把GPT打造成下一代操作系统。大家都在争夺这个未来操作系统的定义权和话语权。

四、ChatGPT不是很热,是还不够热

问:您如何看待ChatGPT?

李涛:ChatGPT做了一件前所未有的事:它利用人类已有的智慧,生成一个历史上从未出现过的全新结果,并将这个结果作为唯一答案呈现出来。这是过去任何机器都无法做到的。

它就像一个拥有7岁孩童智慧的系统,既能模仿,也能创新。好比看了无数画作后,它能自己创作一幅全新的画。

问:目前行业对ChatGPT的接受度如何?

李涛:认知仍然滞后。前段时间我MBA课程有一份关于日本工匠精神的作业,我完全用ChatGPT生成了讲解PPT。第二天展示时,很多同学还对ChatGPT感到惊讶和陌生。

问:APUS内部AI的应用到了什么程度?

李涛:所有内部系统都已接入AI。图片和图标设计完全由AI完成,超过一半的程序员代码都由AI进行审核。

问:如何提升员工使用AI的积极性?

李涛:去年春节后,我们制定了一套奖励机制:要求所有程序员、设计师及一线生产员工必须使用AI提升效率。效率提升30%的,加薪10%;提升50%以上的,加薪20%到30%。用真金白银激励大家拥抱新技术。

问:如果全行业都普及了AI,企业的核心竞争力将体现在哪里?

李涛:核心差异将体现在:谁更早想到使用AI,谁用得更加彻底,谁的生产效率提升得最快。在这场效率革命中,领先一步,潜力就大一分。

来源:https://www.leiphone.com/category/ai/z9lSpVllaMA7Fff4.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

银河麒麟系统SSH公钥登录配置与安全远程连接指南
系统平台
银河麒麟系统SSH公钥登录配置与安全远程连接指南

在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c

热心网友
05.15
银河麒麟系统登录循环故障解决方法与桌面修复指南
系统平台
银河麒麟系统登录循环故障解决方法与桌面修复指南

登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而

热心网友
05.15
GUSD稳定币详解:项目背景、核心用途与投资风险全解析
web3.0
GUSD稳定币详解:项目背景、核心用途与投资风险全解析

GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。

热心网友
05.15
Win11如何设置默认音频输出设备与调整音量
系统平台
Win11如何设置默认音频输出设备与调整音量

在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱

热心网友
05.15
宏胜集团高管变动与业务外包调整深度解析
AI
宏胜集团高管变动与业务外包调整深度解析

宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并

热心网友
05.15