首页 游戏 软件 资讯 排行榜 专题
首页
AI
面壁李大海谈行业大模型发展历程与阶段性定位

面壁李大海谈行业大模型发展历程与阶段性定位

热心网友
80
转载
2026-05-15

近日,在北京市石景山区人民政府、北京市经济和信息化局、北京市科学技术委员会中关村科技园区管理委员会联合主办的服贸会分论坛——“通用人工智能算力论坛”(AGICF)上,面壁智能正式发布了千亿参数多模态大模型“露卡”(Luca),并开启了其2.0版本的全民公测。

“露卡”之名,源于地球生命始祖的英文缩写(The Last Universal Common Ancestor),寓意着对通用人工智能本源探索的雄心。回顾其发展历程,今年5月底的2023数博会上,Luca 1.0首次公开亮相。随后的三个月里,模型经历了85次快速迭代,其大语言模型核心能力整体提升了39%。尤为突出的是推理能力,实现了119%的跃升,在推理、知识、生成等多个维度已可媲美ChatGPT。

此次推出的Luca 2.0,不仅延续了强大的语言模型能力,更关键的是集成了卓越的多模态处理能力。其图片理解能力,在中文语境下已处于领先水平。在多模对话、细节描述和复杂推理三项综合评测中,Luca 2.0取得了92.5分的整体得分,远超行业其他支持中文图片理解模型78.4分的平均分。

论坛结束后,面壁智能CEO李大海接受了媒体群访,就通用大模型的路径选择、近期热议的一体机模式、知乎数据对训练的独特价值以及大模型评测等热点话题,分享了团队的思考与实践。

1. 坚定走向通用大模型之路

问:目前资本与科技圈对大模型的态度似乎呈现“冰火两重天”,您当前关注的核心问题是什么?

李大海:当前行业普遍聚焦于大模型如何落地。我们的精力主要分配在几个方面:首先是模型的封闭式专项开发,这种模式效率极高,使得团队能在三个月内将模型从百亿参数规模推进到千亿级别,这个过程挑战巨大。另一方面,则是在持续思考哪些是真正值得投入的应用方向,以及应用如何与大模型深度结合。这里就引出了一个根本性问题:大模型与应用的关系。

我们坚信,必须致力于开发“大模型原生应用”。这类应用应构建于大模型之上,其存在本身便依赖于大模型的能力。反观当下,不少应用只是在现有流程中接入了大模型API,虽然能带来一定效率提升,但这并非典型的原生应用。当然,我们也不认为原生应用就意味着100%由大模型驱动,那无异于“拿着锤子找钉子”。真正的关键在于关注用户的真实需求,审视在引入大模型这一变量后,需求是否能被更优地满足。

问:如何看待B端业务及行业大模型的发展前景?

李大海:B端业务我们同步在开展,但现阶段更侧重于C端。过去半年,我们看到许多同行被客户需求推着走,疲于应付项目制的定制化要求。在模型标准化尚未完善的情况下,提供这类服务需要投入大量人力进行填补,交付效率是个问题。

商业的本质要求我们必须关注效率与健康的损益结构。纯粹的ToB项目制模式,其定位和毛利率往往面临挑战。要实现高效交付,路径无非两条:要么针对特定场景训练一个相对优秀的模型,再为每家客户进行微调;要么打造一个足够通用的强大模型,使其能通过轻量微调适配各种场景。我们相信,未来一定属于通用人工智能的方向。

现阶段,行业大模型凭借更小的参数量在垂直领域成本占优,加之通用大模型的能力尚未全面碾压,因此有其存在空间。但可以预见的是,未来必然会出现能力更强、成本更低的通用模型,届时它将极大挤压甚至抹平行业模型的市场空间。因此,行业大模型更多是当前技术阶段的过渡性产物。

问:面壁大模型从百亿跃升至千亿,与团队此前“悟道2.0”时期从百亿到千亿的进化有何不同?

李大海:从技术路线上看,当时推出的CPM2千亿模型采用的是MoE稀疏架构,与当前发布的千亿模型在结构上有所不同。我们现在的千亿模型是Decoder-only的网络架构。值得一提的是,CPM大模型是面壁智能从零开始自主研发的预训练大语言模型系列,其中包含了国内首个中文大模型CPM-1。而CPM-Live项目第二期开源的百亿模型CPM-Bee,作为国内首个免费商用的开源基座模型,目前已授权数百家企业使用。

问:发布千亿多模态大模型,是否会影响团队在大语言模型(LLM)上的研发重心?

李大海:需要明确的是,公司的核心资源依然聚焦于大语言模型,这是所有能力的基石,必须首先夯实,这也是我们的阶段性战略。我们的优势在于产学研紧密结合,大语言模型的研发不仅是公司行为,更是与顶尖实验室深度合作的结果。将大语言模型这个基座做得越来越扎实,我们才能更顺畅地接入多模态数据与学习任务,这是一个水到渠成的过程。

问:知乎提供的数据集对模型训练带来了哪些独特优势?

李大海:模型能取得优异成绩,知乎高质量图文数据的贡献功不可没。知乎作为一个高质量社区,用户在上传图片时,往往会精心配以详细的文字说明。这种用户生成内容的质量,远高于第三方标注平台生产的标准化数据,为模型理解图文关联提供了极为宝贵的素材。

2. 开源、竞争格局与一体机

问:如何看待开源大模型在ToB领域的影响?

李大海:目前来看,开源对于厂商的主要价值仍在于提升模型的影响力和知名度。因为当前的开源生态尚未形成类似安卓的完整体系,例如客户用自己的数据训练后,数据不会回流,模型的实际使用效果也难以获得集中反馈。这种影响力的提升对ToB业务有帮助,但链条较长,效果比较间接。

当竞争进入深水区,各家模型能力趋同时,客户会更关注服务提供商自身的持续运营能力、售后保障等综合实力。这很像电动汽车行业的发展初期,百花齐放时早期用户多为尝鲜者;但当大众市场启动后,品牌的制造体系、服务网络等综合能力就成为关键。

问:通用大模型的未来,更可能诞生于大公司还是创业公司?

李大海:参考美国市场,头部科技公司也并未垄断通用大模型的全部疆域。这件事的成败,归根结底取决于公司的创新能力。这是一个由人才、资源、组织效率、创新容忍度、战略定力等多重变量共同决定的综合竞赛,并无定式。

问:如何看待当前流行的大模型评测榜单?

李大海:在大模型领域,榜单本身似乎陷入了一个悖论。一旦某个榜单获得广泛认可,就几乎必然引发“刷榜”行为,这很难避免。除非未来能出现一个由大模型动态、随机生成题目,且公信力得到公认的评测体系。目前来看,为时尚早。

核心原因在于,大模型的“背题”能力极强。只要题目被获取并喂给模型,它就能迅速记住答案。我们观察到一个有趣的现象:模型一旦能“记住”,它往往就放弃了“理解”。

问:Luca公测以来,收到的使用申请情况如何?

李大海:正式发布后,我们收到了大量使用申请,团队正在逐一审核批准。目前推理资源仍处于限量供应阶段,具体数字不便透露。我们会根据服务需求,动态提升供给能力。

问:传闻面壁也在筹备大模型一体机,您对此模式持何看法?

李大海:关于一体机,我们确实在与合作伙伴紧密推进,但具体进展暂不便透露。从市场角度看,一体机是国内ToB市场特定环境下的产物。其产生背景在于,部分国内企业客户习惯性地低估软件价值,而高估硬件价值。软硬件一体化的形态,有时更能体现产品的整体价格。

不过,从技术发展趋势而言,更看好云服务模式。将复杂的运维、算力调度等工作交给专业的云厂商,模型研发公司才能更专注于核心的算法与模型创新本身。

来源:https://www.leiphone.com/category/ai/23kbzQXj60xZgUgO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

面壁李大海谈行业大模型发展历程与阶段性定位
AI
面壁李大海谈行业大模型发展历程与阶段性定位

近日,在北京市石景山区人民政府、北京市经济和信息化局、北京市科学技术委员会中关村科技园区管理委员会联合主办的服贸会分论坛——“通用人工智能算力论坛”(AGICF)上,面壁智能正式发布了千亿参数多模态大模型“露卡”(Luca),并开启了其2 0版本的全民公测。 “露卡”之名,源于地球生命始祖的英文缩写

热心网友
05.15
端侧AI的密度法则与昇腾算力协同实践
科技数码
端侧AI的密度法则与昇腾算力协同实践

过去几年,大模型行业的注意力更多集中在云端,关注参数规模、推理速度或者能力榜单,而如今,客户关心的不是模型能不能更“强”,而是能不能在真实算力条件下跑起来,能不能稳定服务用户,能不能把成本压到一个可

热心网友
03.30
中国电信领投:墙面智能获数亿元融资开启新篇章
科技数码
中国电信领投:墙面智能获数亿元融资开启新篇章

近日,面壁智能完成马年春节之后首轮融资,迎来新春“开门红”。 本轮融资规模数亿元,由中国电信领投、中信金石、中信私募跟投。其中,中国电信作为战略投资方,将与面壁智能展开深度业务协同。中国电信将发挥

热心网友
02.28
壁仞科技获融资,高密度大模型创新受国家队战略青睐
科技数码
壁仞科技获融资,高密度大模型创新受国家队战略青睐

2月28日,面壁智能官宣2026年首轮数亿元融资。本轮融资由中国电信领投,中信金石、中信私募跟投。本轮融资显示了资本行业对面壁在“端侧大模型”赛道领先地位以及高密度技术创新的认可。具体来看,中国电信

热心网友
02.28
中国电信战略投资面壁智能:AI与算力设施协同新突破
科技数码
中国电信战略投资面壁智能:AI与算力设施协同新突破

来源:环球网【环球网科技综合报道】2月28日消息,近日,面壁智能宣布完成新一轮数亿元融资,由中国电信领投,中信金石、中信私募跟投。在行业步入‘中场战事’、商业化落地成为核心命题的当下,面壁智能在春节

热心网友
02.28

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

银河麒麟系统SSH公钥登录配置与安全远程连接指南
系统平台
银河麒麟系统SSH公钥登录配置与安全远程连接指南

在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c

热心网友
05.15
银河麒麟系统登录循环故障解决方法与桌面修复指南
系统平台
银河麒麟系统登录循环故障解决方法与桌面修复指南

登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而

热心网友
05.15
GUSD稳定币详解:项目背景、核心用途与投资风险全解析
web3.0
GUSD稳定币详解:项目背景、核心用途与投资风险全解析

GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。

热心网友
05.15
Win11如何设置默认音频输出设备与调整音量
系统平台
Win11如何设置默认音频输出设备与调整音量

在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱

热心网友
05.15
宏胜集团高管变动与业务外包调整深度解析
AI
宏胜集团高管变动与业务外包调整深度解析

宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并

热心网友
05.15