首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
AI公司如何实现估值170亿:独角兽成长路径深度解析

AI公司如何实现估值170亿:独角兽成长路径深度解析

热心网友
63
转载
2026-01-07
听闻此乐,源自奥菲斯
量子位 | 公众号 QbitAI

人工智慧模型竟技平台LMArena宣布成功获得1.5亿美元A轮融资。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

平台估值一举跃升至170亿美元,这份新年贺礼可谓分量十足!



本轮融资由Felicis和加州大学投资管理公司UC Investments领投,Andreessen Horowitz、The House Fund等知名机构跟投。

资本市场用真金白银投票,足以见得在AI大模型时代,评估平台这条赛道多么炙手可热~

而这家成员99%为华人、核心团队均为90后的明星企业,其走红之路还得从2024年ChatGPT横空出世说起。

从学术探索到商业崛起

LMArena的前身,是曾经在AI圈掀起热潮的Chatbot Arena,最初由非营利开源组织LMSYS创建。

该组织的核心成员均来自加州大学伯克利分校、斯坦福大学、加州大学圣地亚哥分校(UCSD)、卡内基梅隆大学(CMU)等顶尖高校的学术精英。

他们主导的开源推理引擎项目SGLang,在业内首次实现在96张H100 GPU上,跑出了与DeepSeek最新报告吞吐量性能媲美的开源方案。

目前SGLang已实现大规模部署,被xAI、英伟达、AMD、谷歌云、甲骨文云、阿里云、美团、腾讯云等众多知名企业和机构采用。

不过,比起硬核技术,他们最主要也更为出圈的工作,却是对大模型进行评估。

在ChatGPT、Claude一众模型刚刚面世之际,他们率先创办了Chatbot Arena这样一个第三方众包基准测评平台。

LMSYS创始人之一、也是SGLang主导者郑恺,曾向我们透露,当时之所以创建Chatbot Arena,是因为他们自己训练了开源模型小羊驼Vicuna。



当时他们觉得自己的模型还不错,但市面上已有的各种基准测试很难真正区分出模型是“真好”还是“假好”。

团队认为,评估模型最好的方式就是将其放到网上,让用户试用并投票。于是他们便搭建了众包测试平台Chatbot Arena,通过实际的用户交互来评估模型性能。

结果没想到的是,后来Chatbot Arena已独立成为一家公司,而小羊驼Vicuna等大模型的研发却已停滞。



早期的Chatbot Arena采用双盲测试模式,让用户在不了解模型身份的情况下盲选出更优的答案,这种模式吸引了大量AI爱好者前来打卡。

后来,全球各地一有新模型更新都会在里面偷偷测一把,Chatbot Arena逐渐成为模型测评首选排行榜。

这样的影响力让Chatbot Arena在AI领域崭露头角,获得了资本市场的认可。

它独立出来成为一家商业公司lmarena.ai,专注于AI模型评估。

2025年5月,被曝获得种子轮1亿美元投资,估值达60亿美元。

动态竞技场

lmarena.ai的主要项目,就是如今全球大模型的动态竞技场LMArena。



核心评估规则围绕匿名对战、Elo式评分和人机协同框架展开,方式也比较有意思。

用户只要输入问题,系统就会随机匹配两个模型来做匿名回答。

这时候大家不用管模型是谁,只需要根据回答的好坏投票选出更优的那个,系统在投完票之后才会揭晓模型的真实身份。

在评分上,平台基于Bradley–Terry模型设计了Elo评分机制,每个模型都有初始分数,赢了就加分,输了就扣分,随着对战次数越来越多,分数会慢慢稳定下来,最终形成实时更新的排行榜。

除此之外,平台还采用了人机协同的评估模式,用人类的真实投票来反映大家对模型的偏好,再通过算法去平衡各个模型的出场次数、任务类型和样本分布,避免有的模型因为曝光多就被高估,或者因为曝光少就被低估,确保整个评估过程公平客观。

就这样,LMArena成了各家新模型“出道”时的必测榜单。当前Gemini 3 Pro以1490分位居榜首。



自去年拿到1亿美元种子轮融资后,LMArena的发展迅速超出预期。

在短时间内不仅累计了覆盖文本、视觉、网络开发等跨模态的5000万张投票,完成了400余种开放及专有模型的评估,还产出了覆盖文本、多模态、专家及职业等多个类别的14.5万个开源战斗数据点。

现在,LMArena计划将新筹集到的资金用于平台运营,确保平台稳定且高效运行,提升用户体验。同时扩大技术团队,为平台发展注入更多专业技术力量。

参考链接:https://news.lmarena.ai/series-a/

— 完 —

来源:https://www.163.com/dy/article/KIMGNAIT0511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路
AI
DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路

新智元报道编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用tok

热心网友
03.30
阿伯丁研究团队破解AI时间推理,突破双重密码难题
科技数码
阿伯丁研究团队破解AI时间推理,突破双重密码难题

这项由阿伯丁大学和格勒诺布尔阿尔卑斯大学联合开展的研究发表于2025年,相关论文编号为arXiv:2603 19017v1。当我们使用ChatGPT或其他AI助手处理时间相关问题时,比如 "2024年

热心网友
03.30
清华大学BEAVER模型:大语言模型智能压缩与加速新方案
科技数码
清华大学BEAVER模型:大语言模型智能压缩与加速新方案

这项由清华大学、青海大学和蚂蚁集团联合进行的研究发表于2026年,有兴趣深入了解的读者可以通过论文编号arXiv:2603 19635v1查询完整论文。随着人工智能技术的飞速发展,我们的聊天机器人和

热心网友
03.30
UCL新突破:AI学会像人类一样主动培养技能与成长
科技数码
UCL新突破:AI学会像人类一样主动培养技能与成长

来自伦敦大学学院(University College London)的研究团队在2026年3月发表了一项突破性研究,该研究于arXiv平台发布,编号为arXiv:2603 18743v1,专门探讨

热心网友
03.30
Anthropic联合创始人:AI两年内将实现自我繁殖,如细胞般进化
AI
Anthropic联合创始人:AI两年内将实现自我繁殖,如细胞般进化

新智元报道编辑:倾倾【新智元导读】AI自主训练的成绩单出炉了!最强Agent 6个月进步3倍,更让人震惊的是,越聪明的AI越会作弊。同时,70多个矿工用家庭宽带训出了72B大模型,黄仁勋亲自点名。J

热心网友
03.30

最新APP

史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28

热门推荐

vivo Pad6 Pro发布:首款4K原彩屏配骁龙8,售4499元起
网络安全
vivo Pad6 Pro发布:首款4K原彩屏配骁龙8,售4499元起

3月30日消息,今晚除了手机之外,vivo还发布了全新的旗舰平板——vivo Pad6 Pro。行业首发13 2英寸4K原彩屏,分辨率3840×2160,347PPI,支持1-144Hz LTPS自

热心网友
03.30
WPS表格提取括号内容:3步掌握MID函数实战用法
电脑教程
WPS表格提取括号内容:3步掌握MID函数实战用法

WPS表格中提取括号内容有四种方法:一、单对英文小括号用FIND+MID;二、中英文括号通用需SUBSTITUTE预处理;三、多对括号取最后一对需REVERSESTRING反向查找

热心网友
03.30
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕
科技数码
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕

3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌

热心网友
03.30
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?
科技数码
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?

电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末

热心网友
03.30
美议员为何急于拉黑中国机器人却暗留后门?
科技数码
美议员为何急于拉黑中国机器人却暗留后门?

白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党

热心网友
03.30