首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
LMArena最新估值170亿美元,为AI大模型提供权威评测半年涨三倍

LMArena最新估值170亿美元,为AI大模型提供权威评测半年涨三倍

热心网友
14
转载
2026-01-08

随着人工智能行业的竞争日益激烈,一家专注于大模型性能评估与排名的初创公司LM正在快速崛起,逐渐成为推动行业发展的关键基础设施。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

根据公司披露的最新信息,LM已完成新一轮1.5亿美元的融资,投后估值达到17亿美元。这一数字较2025年5月宣布种子轮融资时的估值增长了近三倍,凸显出市场对独立第三方AI评估平台的迫切需求。

本轮融资由现有投资者Felicis和加州大学投资部门共同领投。所筹资金将主要用于支付算力成本,以支持其为OpenAI、Google、xAI和Microsoft等客户评估AI模型,同时用于扩充技术团队。作为行业内被广泛引用的基准,LM通过“背靠背”比较的方式,利用数百万用户的反馈生成模型排名,直接影响着各大科技巨头在AI领域的声誉与竞争格局。

LM首席执行官兼联合创始人Anastasios Angelopoulos指出,顶尖的实验室正在使用该平台,因为它们面临着难以客观评估自身模型优劣的挑战。这种评估机制不仅帮助开发者在公开发布前获得早期反馈,也已成为AI模型开发商对外宣传其技术实力的核心依据。随着AI模型间的性能差异日益缩小,LM的排行榜已成为衡量行业技术进步的重要标尺。

尽管LM依靠无偿互联网用户反馈的模式引发了部分关于数据准确性和专业性的争议,但这并未阻碍其商业化进程的加速。公司披露,上个月其“年化消费运行率”已达到3000万美元,表明其基于客户使用量的收入潜力正在快速释放。

独特的评估机制与行业影响力

LM的核心竞争力在于其独特的众包评估模式。该公司邀请全球互联网用户提问或使用模型进行图像等内容创作。用户在不知晓模型具体名称的情况下,从两个选项中挑选出最佳答案,随后系统才会揭晓生成该输出的模型身份。LM将这些结果汇总成不同类别的排行榜,涵盖AI编程、图像及视频生成等多个领域。

这种机制使得LM成为了AI行业的“竞技场”。甚至在模型正式向公众发布前,该初创公司有时也会托管这些模型,为开发公司提供早期的市场反馈渠道。随着各家AI模型的性能差距逐渐缩小,开发商们越来越依赖LM的排名来证明其技术优势。Anastasios Angelopoulos强调,对于那些试图在激烈的市场竞争中确立地位的实验室而言,这种外部验证至关重要。

商业化进展与用户规模

在财务表现方面,LM展现出强劲的增长势头。尽管公司未透露最近具体的营收增速,但在去年9月,其年化收入规模已达数百万美元。而根据其对上月客户使用量的推算,目前的年化消费运行率已激增至3000万美元。

用户基础方面,LM表示目前在150个国家拥有超过500万月度用户。这一数字既包括访问查看排名的访客,也可能包括实际参与模型评分的用户。这一庞大的用户群构成了LM数据护城河的基础,为其排名的广泛性和实时性提供了支撑。

面临的争议与竞争挑战

尽管增长迅速,LM的模式并非没有争议。

一些模型制造商批评称,依靠无偿的互联网用户进行反馈存在缺陷,可能面临被刷榜的风险,且无法反映专家的深度意见。

这一批评指出了大众评审与专业评审之间的张力。相比之下,Scale AI等竞争对手采取了截然不同的路径,通过聘请律师或教授等专家为模型提供付费反馈,以强调评估的专业性和严谨性。LM未来如何在保持规模效应的同时提升评估的权威性,将是其持续获得市场信任的关键。

来源:https://www.163.com/dy/article/KIMVN0TE05198NMR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

红旗阿里云联手,首次详解智能座舱“执行能力”
科技数码
红旗阿里云联手,首次详解智能座舱“执行能力”

导读:红旗“灵犀座舱”的尝试,既是大模型上车的进一步落地,也反映出智能座舱正在从信息交互工具,向车内服务入口转变。 【文 观察者网 周盛明 编辑 高莘】 在智能座舱从语音助手向大模型阶段演进的过程中

热心网友
03.29
未来12个月AI大模型趋势:杨植麟、罗福莉等行业洞察
科技数码
未来12个月AI大模型趋势:杨植麟、罗福莉等行业洞察

人工智能(AI)无疑是当下最能提起人们兴趣的话题之一,当AI圈的明星人物齐聚一堂,便自然而然成为聚光灯的焦点。2026年中关村论坛年会一场AI主题论坛上,座无虚席,甚至会场边上都挤满了站着的听众。舞

热心网友
03.29
昆仑万维AGI战略:四大模型与三大平台如何定义AI Native
科技数码
昆仑万维AGI战略:四大模型与三大平台如何定义AI Native

来源:环球网【环球网科技报道 记者 冯超男】“回望过去三载,AI经济完成了发展历程中的第一次范式跃迁,从移动互联网的流量经济迈入以大模型为核心的工具化时代。如今,行业浪潮奔涌向前,迎来了第二次跃迁,

热心网友
03.28
华为AI深度布局:如何引领科技变革新格局
AI
华为AI深度布局:如何引领科技变革新格局

新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王

热心网友
03.28
华为诺亚方舟实验室主任汪云鹤离职
科技数码
华为诺亚方舟实验室主任汪云鹤离职

3月28日,华为诺亚方舟实验室主任王云鹤在朋友圈宣布离职。网传截图显示,王云鹤写道:“8年了,准确来说是9年了(2017年北京第一个实习生),怀着不舍的心告别曾经奋斗过的地方。感谢领导们同事们一直以

热心网友
03.28

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

苹果或牵手长江存储:国产闪存芯片替代三星SK海力士
网络安全
苹果或牵手长江存储:国产闪存芯片替代三星SK海力士

3月29日消息,据行业爆料,苹果计划在面向中国市场销售的iPhone机型中,搭载长江存储的NAND闪存芯片,以此破解当前存储芯片涨价带来的盈利困境。自去年下半年起,全球内存与存储芯片进入涨价周期,手

热心网友
03.29
为取代三星SK海力士 苹果或将牵手长江存储
iphone
为取代三星SK海力士 苹果或将牵手长江存储

3月29日消息,据行业爆料,苹果计划在面向中国市场销售的iPhone机型中,搭载长江存储的NAND闪存芯片,以此破解当前存储芯片涨价带来的盈利困境。自去年下半年起,全球内存与存储芯片进入涨价周期,手

热心网友
03.29
剪映素材包取消教程:3步教你删除不需要的附加素材
电脑教程
剪映素材包取消教程:3步教你删除不需要的附加素材

近年来,手机短视频迅速走红,已深度渗透进大众的日常生活中,成为人们表达自我、记录生活的重要方式。在欣赏他人精良制作的短视频之余,越来越多用户也开始尝试用手机拍摄并剪辑属于自己的原创

热心网友
03.29
360极速浏览器下载故障?三步轻松修复文件无法下载
手机教程
360极速浏览器下载故障?三步轻松修复文件无法下载

在使用 360 极速浏览器时,有时会遇到无法下载文件的情况,这确实会给我们带来一些困扰。别着急,下面就为您介绍几种常见的解决方法。检查网络连接首先,确保您的设备已成功连接到稳定的网

热心网友
03.29
小米智驾显威力,130km/h成功紧急避让防止追尾
编程语言
小米智驾显威力,130km/h成功紧急避让防止追尾

3月29日消息,日前,一位小米YU7车主发视频称,感谢小米汽车救了自己一命。车主表示,当时自己在高速上打开了辅助驾驶,车速设置在130km h。期间,他驾车分心了没看路,前方出现了三角警示牌也没有注

热心网友
03.29