首页 游戏 软件 资讯 排行榜 专题
首页
AI
对话张林:大模型商业化需开源与闭源并行,开源落地优势有限

对话张林:大模型商业化需开源与闭源并行,开源落地优势有限

热心网友
67
转载
2026-05-15

回望信息时代的发展脉络,大致可以划分为三个阶段:信息收集、信息传播和信息压缩。它们分别对应着过去的PC时代、移动互联网时代,以及我们正在步入的智能时代。

一个不争的事实是,经历了PC时代对信息的广泛收集与获取,以及移动互联网时代低成本、爆发式的传播之后,我们如今面对的是信息的海洋。随之而来的核心挑战是:在人类大脑物理容量无法改变的前提下,如何以低损耗、低成本的方式,实现高质量的信息压缩与提取。

对此,共生矩阵CEO张林提出了一个观点:大模型,或许是当下最好的信息压缩机。

那么,自研一个基础大模型,并冲进C-Eval榜单前十需要多久?共生矩阵给出的答案是:两个月。而从榜单前十挤进前三,又需要多久?这次,时间缩短了一半,不到一个月。

与竞争激烈的北京、上海等地的大模型创业战局不同,共生矩阵扎根深圳,是国内少数选择在南方进行大模型自研的团队。其团队规模“小而美”,不足十人,却在近一年内累计发表顶级论文近20篇。多位核心成员曾就职于IDEA研究院,在过去两年间积累了深厚的大模型工程经验。

相较于年初的大模型投资热潮,有投资人向本站表示,目前行业的第一轮融资已基本完成,赛道正驶入稳步发展阶段。业界对场景化落地、满足用户碎片化需求的方向愈发明确,同时也对通用大模型在工程优化与成本控制方面提出了更高要求。

针对这一行业性难题,张林指出,从商业逻辑看,革新性技术必然催生新的商业模式。当前,许多大模型公司将自己定位为MaaS(模型即服务)提供商,但由于边际成本过高,这种模式很可能难以为继。

而更值得警惕的一个误解是,许多人仍将大模型视为独立的软件产品,并沿用互联网时代的软件售卖思维来规划其商业化路径。张林强调:“大模型要发挥真正价值,绝不能作为一个孤立的系统存在,它必须融入一个成体系的生态。大模型的商业化,也必然要立足于某种生态系统来构建。”

当前,大模型落地正蓄势待发,开源可商用的模型也越来越多。凭借公开的源代码,企业可以根据自身需求进行训练和二次开发,因其支持微调、门槛较低,开源模型被许多企业视为优选。对于这种观点,张林认为,开源模型的出现,更多地是让市场能够以较低成本直观感受模型技术的发展阶段,起到了教育市场的作用。但在真正的落地环节,开源模型并不会对自研大模型构成实质性的冲击。

以下为本站与张林的对话实录,内容经过不改变原意的编辑及整理:

GS-LLM 二次上榜

本站:共生矩阵成立于今年5月,在这个时间点选择从IDEA研究院出来创业,是出于怎样的考虑?

张林:我们团队长期身处技术研发一线,因此对大模型的优势与短板有着更切身的体会。每当新技术浪潮来临,追本溯源至关重要——我们需要弄清技术从何而来。GPT的横空出世,其正面意义在于教育了市场,让大多数人意识到,这项技术已不再停留于科幻构想,而是具备了强大的实用能力。

但从另一个角度看,GPT并非凭空出现、由OpenAI科学家突发奇想的创造。它诞生于一线科研人员高强度的技术交流与碰撞之中。OpenAI会关注业界的论文,整个行业也在学习OpenAI的工作。技术进步是由一个群体共同推动的,而非依赖某个人的灵光一现。当然,在GPT-3论文发布之前,业界对于通过堆叠Transformer参数量来实现能力跃迁仍处于猜测阶段。直到2020年OpenAI那篇论文问世,这件事才算被“盖棺定论”。

有数据显示,OpenAI在过去几年烧掉了巨额资金。在短时间内投入如此规模的资源,是绝大多数机构难以想象的。这其中涉及的工程化复杂程度极高,即便论文公开了方法,对于想要参与这场顶级游戏的人来说,门槛依然巨大。因此,从格局上看,中国企业目前的一些差距,根源或许在于资源投入的悬殊。想要追赶上当前ChatGPT的表现,可能还需要一两年时间,这个“学费”是省不掉的,所谓的“弯道超车”并不现实。

我们的态度是:不迷信、不追求极端复刻某一条技术路线,而是紧盯最终目标,探索属于自己的方法论。

自C-Eval榜单发布以来,前五名的位置相对稳固,少有变动。我们用了两个月时间推出自研大模型GS-LLM-Alpha,在七月份首次上榜。时隔不到一个月,我们发布了全新的GS-LLM-Beta版本,再度上榜并攀升至榜单第三位。

本站:评测指标显示,在C-Eval榜单上,几乎所有模型的参数量级都比GS-LLM-Beta要高。与其他模型相比,共生矩阵模型的优势体现在哪里?

张林:优势是一个相对的概念。对于规模更大、拥有充足算力与人才储备的研发机构而言,他们可以训练参数量更大的模型,从而获得更好的性能表现。例如,智谱AI的模型表现优于我们,部分原因就在于其模型规模更大。但现实情况是,部署一个像GLM-130B这样的大模型,年成本可能高达数千万,这是绝大多数客户无法承受的。相比之下,我们的团队体量较小,因此在模型成本上可以比其他大模型低一个数量级。所以说,优势需要结合具体的应用场景来看。

从技术视角转向产品视角,今天讨论大模型商业化,存在一个常见的误解:有些创业者认为自己的技术足够厉害,客户就应该为此付费。但现实往往是,面对一项用户未曾真实接触过的技术,很难直接走到落地阶段。

这就好比汽车和发动机的关系。不能因为自己的发动机做得优秀,就强迫用户来买你的“车”,结果用户发现座椅不舒服、方向盘也不灵。客户需要的是一辆能开回家、满足出行需求的车。也就是说,大模型必须能在实际生产场景中解决问题、发挥作用,同时控制好交付的性价比。

本站:GS-LLM的单次训练成本大概在什么范围?

张林:我们将成本控制在一个很低的水平。

首先,我们有一套自研的训练框架,能够自适应不同参数规模的模型,从1B到200B都可以兼容,这大大提升了训练效率。同时,为了增强生成内容的可控性,我们研发了相应的可控技术,可以实现数据领域的灵活切换。其次,在训练经验上,团队成员大多拥有大模型训练的直接经验,这显著减少了试错次数,通常一次训练就能成功。上述这些因素,都在不同程度上降低了整体训练成本。

一个基本事实是,真正做过大模型、具备相关经验的人才是非常稀缺的。即便是在大厂,过去专门从事大模型技术研究的人也并不多。而当技术定位为商业化产品时,还取决于是否有合适的人能将事情做成。目前,我们具备这样的能力,能够通过提升组织效率和技术能力,以最低成本完成目标,从而拓展更广阔的商业化潜力。

本站:目前的融资进展如何?

张林:正在洽谈中,各方面反馈比较乐观。在选择合作伙伴时,我们看重的一点是,对方能否在整个生态链中提供一个稳健的支撑点。资金固然重要,但作为一家推进商业化的公司,我们非常重视并希望获得整个生态体系的支持,包括上下游的客户资源等。

大模型革新商业模式

本站:大模型发展日新月异,共生矩阵成立三个月以来,你们的战略路线是否有过调整?

张林:事实上,从决定创业的第一天起,我们就在思考如何构建商业化体系、如何获取客户。

目前,部分大模型厂商的商业化模式主要依赖API售卖,模式相对单一。这导致在高成本投入后,很难在短期内实现大规模部署。找到技术解决方案只是第一步,最终还是要让客户愿意买单。想清楚这一点后,我们清晰地确立了“两条腿走路”的策略。

第一,在技术上必须把大模型的基础打磨扎实,这是我们团队的立身之本。第二,要第一时间与真实客户接触。虽然公司成立时间短,但我们的第一个To B客户已经产生,预计到今年十月,签约的付费客户将达到3-4家。必须从行业实际需求出发,在真实环境中获取反馈,而不是困在自我闭环的逻辑里。只有找到市场的真实痛点,站在用户立场解决问题,公司才能持续成长。

本站:在客户选择上,共生矩阵主要瞄准哪一类?

张林:这是个很有意思的问题,它关乎如何在大模型时代重新定义“行业”。大模型出现后,传统的行业划分界限变得模糊。例如服装设计、珠宝设计、建筑设计,听起来分属不同行业,但从我们的视角看,它们拥有相同的“设计”内核,模型提供服务的方式是相通的。

从大模型的能力范围看,它确实可以渗透的领域太广了,似乎什么都可以尝试。因此,我们更聚焦于特定的“场景”,而非完全按传统行业划分。现阶段,我们重点布局金融或相近领域,选择那些商业闭环短、需求明确的场景作为切入点,提供智能化的Copilot(副驾驶)服务。

本站:这是否意味着你们需要在众多领域进行项目交付,会不会导致过多人员和精力耗费在交付上?

张林:这个问题提得很好。我们的目标是打造标准化产品,并实现轻量化交付。关键在于,许多客户的需求表面看似不同,但得益于大模型的通用能力,找到其中的共性并不困难,从而形成标准化的产品方案。

我们也会主动从几个方面去寻求和固化这种共性:第一,从源头控制,避免切入差异化过大的场景,确保交付内容可复制、可推广,形成标准化产品。第二,从开发角度,专注于用户的核心需求,打造一个底层足够优秀的模型和产品形态。这样,即使面对不同类型的客户和数据,也只需在基础模型之上进行微调即可适配。

本站:你之前提到大模型“教育”了市场,从产品方向看,它具体带来了什么改变?

张林:大模型带来了巨大的机遇,同时也是全新的挑战,这是过去AI公司未曾经历过的。以往的AI技术,通常是解决长生产链条中的某一个环节,大家对它的期待相对有限,只要把那个特定环节做好就行。但今天,大模型对生产链条的影响是碘伏性的,它推翻了旧有的许多流程和环节。

大模型的革新,是从底层技术开始,逐渐向上层应用逻辑迁移和重构,并最终深刻影响商业模式的走向。

本站:如何理解大模型对商业模式的这种革新?

张林:首先需要回答,行业究竟是什么?在第一产业中,通常是先有新的生产力工具,然后催生出新的岗位,进而衍生出相应的行业。比如,先有了飞机,才诞生了航空业,继而提供航行服务。

我们经常观察到一个有趣的现象:科技进程通过媒介信息的介入,会对一项新技术产生“放大”效应。这里的“放大”是个中性词,它既能放大技术好的一面,也能放大其不足。对于前沿技术而言,这就产生了一个新问题:是否大多数人都具备足够的专业能力去做判断?对于不同赛道的企业,接入新技术的门槛也各不相同,因此在交流中产生的认知差距因人而异。可以说,商业化路径该如何走,我们正是第一批探路者。

举个例子,过去AI技术公司与厂商合作,假设A公司做研发,B公司购买服务,只需支付研发费用或产品费用,交易就完成了。但到了大模型时代,商业模式被完全碘伏。A公司提供基础模型,当它与B公司合作时,B公司贡献了场景数据。那么,最终模型效果提升,究竟归功于A公司的模型优秀,还是B公司提供了优质数据?目前这很难界定,相应的合同又该如何拟定?这些都是需要探索和解决的新问题。

本站:对于这些问题,OpenAI给出答案了吗?

张林:一项新技术从出现到快速商业化,其发展趋势往往被我们称为“白菜化”,大模型也不例外。OpenAI并没有完全解答商业化究竟该如何做。To C的模式是否成立?目前看来似乎并不确定,因为成本始终居高不下。

同时,OpenAI面临一个更大的问题:技术下一步该往哪里走?某种程度上,这又回到了从零开始探索的状态。对于那些模型能力尚未达到ChatGPT或GPT-3.5水平的机构,现阶段的目标是追赶和实现。但对于OpenAI而言,在投入巨资并成功走通大模型路径之后,下一步的方向是什么,无人知晓,需要重新探索。

开源模型没有落地优势

本站:目前市面上开源可商用的大模型越来越多,你如何看待开源模型在竞争中的位置?

张林:很多人讨论开源大模型对闭源模型的影响。在我看来,在商业层面,这种影响微乎其微。当然,我们也乐见其成,开源能让更多人低成本地体验和感受模型技术发展到什么阶段,起到了教育市场的作用。但这并不会从实质上改变竞争格局。

今天玩转大模型,最核心的因素其实是“人”。

事实上,在2023年之前,国内真正拥有大模型训练经验、有相关积累的个人或机构,总数估计不会超过100人。做出这个判断的依据是:首先,能够启动足够数量算力机器、具备一定规模算力集群和资源的机构,在全国范围内本就是少数。其次,并不是在2022年底或2023年初成立公司,团队就自然而然会训练大模型了。经验积累是一个漫长的过程,没有实操经验的人很难成功。

在这些“训练”大模型的人中,有些会使用开源模型进行微调,但这通常规模很小,可能只用一张卡(比如LoRA)。而我们一上来往往就是动用上百张甚至更多的卡。像LoRA这类方式,距离真正能产生商业价值的产品还非常遥远。

简单来说,首先在训练层面,开源模型不会告诉你具体怎么训。即便你下载了LLaMA2的代码,但前期的数据准备、配比等关键细节,不会有人手把手教你Meta内部是如何操作的。这些是极其关键的技术诀窍,无法从开源代码中获取,只能靠经验积累。更重要的是,开源通常只提供预训练部分,而这恰恰是整个大模型体系中最不重要的环节。其他更具挑战性的工作,如模型优化、人类反馈对齐、模型压缩、可控性增强等,都是开源无法提供的。这是一个必须“交学费”的过程。而在当前企业军备竞赛、迫切追求商业化的环境下,绝大部分公司都给不了团队在开源中慢慢摸索的漫长时间。

本站:国内有哪些公司在做的事情与共生矩阵类似?

张林:我觉得每家公司的路径都不太一样,很难用“类似”来概括。如果从局外人的视角看,我们都是做大模型的公司。但从各自的成长路径而言,我们总结自己与大部分初创公司的不同在于:首先,很少有初创公司一上来就直接挑战客户对接和落地,大部分会经历一段技术沉淀期。而共生矩阵从一开始就选择了商业化路径,并且是To B的方向。

To B企业的一个特点是,由于其数据敏感性,他们很难接受纯API的调用方式。而开源模型很多时候只能完成简单任务。最终要实现应用落地,一切的前提还是回归到自主研发能力必须足够强,在此基础上才能谈长期的商业合作。

本站:对于创业公司而言,现阶段的资本市场似乎也越来越谨慎。

张林:是的,现在的情况是“谈的多,投的少”。投资方越来越看重公司实际的商业营收能力。这也是为什么过去几个月,国内冒出很多模型,但我们真正关注的很少。因为大部分机构其实并不真正理解大模型的特性,也缺乏对商业化路径的预判能力。市场上大部分信息属于“噪声”,不必过于关心。最重要的事情,必然只有少数人能看懂。

我们关注的核心,应该是哪些人在真正做有价值的事情,以及我们的客户究竟需要什么样的产品或服务。

本站:你们所关心的“核心的人”具体指哪些?

张林:首先是国内几家真正具备大模型研发能力的企业和高校。从技术演进的角度,真正能带来实质性改进的机构是极少数。我们需要始终保持在一线,了解技术正在朝哪个方向演进,哪怕是一些微小的变化,也要留意其潜在的可能性。

另一方面,我们密切关注市场变化。我们相信,商业层面的洞察,直接从客户那里获取反馈最具价值。例如,我们很早就排除了单纯做API供应商的可能性。这种模式客户面窄、接受度不高,其定价决定了只有少数高净值、达到一定规模的大企业才能付费。而面对大量的中小客户,他们面临的核心问题就是预算有限。因此必须接地气,走到真实场景中去,看看能以多低的成本让用户接受并长期使用。只有将边际成本降低到一个足够低的门槛,才能真正意义上实现大模型商业化的繁荣。

来源:https://www.leiphone.com/category/ai/Sk5L0JRhJaHilpFR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

实在塔斯大模型:AI大模型技术解析与应用指南
业界动态
实在塔斯大模型:AI大模型技术解析与应用指南

在人工智能浪潮中,大语言模型已成为推动产业变革的关键引擎。其中,实在智能推出的实在塔斯(TARS)大模型,是一款面向垂直行业领域、可自主训练的类ChatGPT大语言模型。它并非通用模型的简单复刻,而是基于实在智能在自然语言处理领域长期的技术积淀与丰富的落地经验,为行业深度定制而生。下面,我们来详细拆

热心网友
05.15
大模型工作流原理与应用场景全解析
业界动态
大模型工作流原理与应用场景全解析

在探索如何高效利用GPT、BERT等大型语言模型的强大能力时,“工作流”无疑是实现任务自动化与智能化的核心策略。它是一套将复杂问题标准化、流程化的系统性方法,旨在显著提升任务执行的效率与输出结果的可靠性。那么,一套优秀的大模型工作流具体包含哪些关键组成部分?我们又该如何设计与实施呢? 工作流的核心要

热心网友
05.15
大模型调用成本太高?教你节省90%费用的实用方法
AI
大模型调用成本太高?教你节省90%费用的实用方法

大模型缓存机制通过KVCache和前缀匹配实现重复内容仅计费一次,显著降低成本。主流方案差异明显:OpenAI自动缓存折扣约五折但时效短;Claude需手动标记,折扣可低至一折;DeepSeek采用硬盘缓存,持久且费用极低。工程中应将稳定内容前置以提升命中率,高频重复场景下合理利用可大幅节省费用。

热心网友
05.15
大模型一体机:定义、功能与应用场景全解析
业界动态
大模型一体机:定义、功能与应用场景全解析

谈及当前企业智能化转型的主流方案,“大模型一体机”无疑是备受关注的核心选项。本质上,它是一套完整的“交钥匙”解决方案,将AI服务器硬件、预训练好的大模型以及配套的应用软件深度融合,打包交付,旨在为企业提供安全、高效、可私有化部署的大模型服务。 一、核心构成:三位一体的“智能体” 这套系统的架构与核心

热心网友
05.15
大模型私有化部署含义与实施指南
业界动态
大模型私有化部署含义与实施指南

企业在引入大型人工智能模型时,面临一个关键抉择:是采用便捷的云端服务,还是选择将模型私有化部署在本地?后者,即将大模型部署于企业自有的服务器或专用硬件上,正日益成为对数据安全、响应速度和成本控制有严格要求的机构的核心选择方案。 一、私有化部署的背景与趋势 在人工智能技术迅猛发展的浪潮中,以实在智能为

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

银河麒麟系统SSH公钥登录配置与安全远程连接指南
系统平台
银河麒麟系统SSH公钥登录配置与安全远程连接指南

在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c

热心网友
05.15
银河麒麟系统登录循环故障解决方法与桌面修复指南
系统平台
银河麒麟系统登录循环故障解决方法与桌面修复指南

登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而

热心网友
05.15
GUSD稳定币详解:项目背景、核心用途与投资风险全解析
web3.0
GUSD稳定币详解:项目背景、核心用途与投资风险全解析

GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。

热心网友
05.15
Win11如何设置默认音频输出设备与调整音量
系统平台
Win11如何设置默认音频输出设备与调整音量

在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱

热心网友
05.15
宏胜集团高管变动与业务外包调整深度解析
AI
宏胜集团高管变动与业务外包调整深度解析

宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并

热心网友
05.15