龙虾之后的大模型共识困境与未来趋势

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|中关村论坛现场
上一次智谱AI与月之暗面同台,还是在1月10日。那天是智谱通过港交所聆讯后的第三天,一个周六,在中关村国际创新中心举行了一场名为AGI-Next的前言峰会。
两个半月后,故事推进得更快了。
市场消息显示,月之暗面正考虑在香港进行首次公司募股(IPO),目前已与中金公司及高盛展开磋商,相关事件仍处于初期阶段,具体时间尚未确定。对此,虎嗅向月之暗面方面求证,对方不予置评。
几乎在同一时间,两家公司再次同台,还是中关村国际创新中心,在中关村论坛的现场。

台上坐着的,是这一轮大模型浪潮中最核心的一批玩家:月之暗面创始人杨植麟、智谱CEO张鹏、无问芯穹创始人夏立雪、小米MiMo负责人罗福莉,以及香港大学助理教授黄超。
他们讨论的,是最近一个月,让整个行业“重新忙起来”的那只龙虾OpenClaw。
过去一个月,这只“龙虾”几乎把大模型的调用曲线重新拉了一遍。包括智谱、Kimi,以及小米MiMo在内的多家模型厂商,都在这一波中吃到了最直接的红利。
3月下旬,在全球最大的模型API聚合平台OpenRouter上,一款代号为 Hunter Alpha 的模型调用量迅速冲上榜首。随后小米认领,这一模型正是MiMo-V2-Pro。
更重要的是,龙虾带来的,并不只是调用量的暴涨。它让行业清晰地看到:大模型开始“干活”之后,一整套新的技术与商业逻辑,正在被同时改写。
这场讨论,指向的是推理阶段正在出现的几条新分水岭。
1、模型开始承担“完整任务链路”
首先,在这场对话中,点出了这只龙虾的价值,首先是几位模型玩家对它的定义,以及它能带来什么。
过去,用户是给大模型提问题,大模型还无法帮用户做任务,或者说过去的那条链路是断的。
而现在,OpenClaw带来的最大变化,是把模型拉进了任务执行环节。用户给出的不再是问题,而是目标;系统需要完成拆解、尝试、修正和交付。
在张鹏的定义里,它更像一个“脚手架”——普通人可以在其上调用顶级模型,完成完整任务链路。用户与模型的关系,也从“提问—回答”,转向“目标—执行—迭代”。
这直接改变了评价方式。单轮回答已经不重要,关键在于复杂任务能否稳定收敛。模型第一次被放进交付结果的语境里。随之出现的,是“慢”的感知。系统在做规划、调度和试错,这些都在消耗时间,也在堆叠能力。
2、继“水电煤”之后,Token开始具备生产力属性
一个被反复提及的信号是:Token正在失控式增长。
夏立雪提到,公司Token用量从1月底开始,每两周翻一倍;而在Agent场景下,单个任务的Token消耗,是传统问答的10倍甚至100倍。
过去,在大模型对话问答时代,Token消耗量低,普通用户免费就能用得AI。但龙虾出现之后,这个共识被推翻了。Token用量在短时间内呈指数增长,已经成为新的共识。Agent任务的消耗量,远高于传统对话。
但Token不再只是成本指标。它对应的是规划、执行、调用工具的全过程,接近一种“机器工时”。这会重塑价格体系。成本上升不再是单纯压力,而是和任务价值绑定,成为新的定价基础。
3、从训练时代,快进到推理时代
简单来说,在智谱、MiniMax等大模型公司还未上市的时间段里,“训练”依然是主流。但龙虾的出现,一下加速了推理时代的到来。
而具体来解释,随着任务复杂度上升,Context长度正在迅速拉长到1M甚至10M级别。这迫使厂商开始在推理侧做结构创新,例如:Hybrid架构、Linear Attention、Long Context Efficient设计。
这些创新架构的核心目的只有一个,就是如何在更长Context下,把成本打下来、把稳定性提上去。
这也意味着竞争维度在下沉:从模型参数规模,转向推理效率、系统调度,甚至能源成本。
4、系统能力开始抵消模型差距
在Agent框架下,模型之间的能力差距被部分压缩。通过Skill和工具组合,次顶级模型也能完成复杂任务。
在这个时候,用户关注点随之变化,更看重任务结果,而非模型本身的指标。
参与门槛也在降低。构建能力逐渐向系统工程倾斜,而不再局限于算法本身。
以下是月之暗面创始人杨植麟、智谱CEO张鹏、无问芯穹创始人夏立雪、小米MiMo负责人罗福莉,以及香港大学助理教授黄超的精选部分对话:
杨植麟:现在最火的无疑就是openclaw,大家在日常使用或者类似产品时,觉得什么最有想象力或印象深刻?我们从技术角度,先请张鹏谈谈对openclaw和相关Agent的看法。
张鹏:我把它称作一个“脚手架”。它提供了在模型基础上搭建非常牢固、方便且灵活的可能性。普通人可以极低门槛地使用顶尖模型,尤其是编程和整体能力。以前想法受限于不会编程等技能,现在通过简单交流就能完成,这是一个非常大的突破。
夏立雪:我最开始用不太适应,习惯了聊天式交互,感觉openclaw很慢。后来发现它其实是能帮我完成大型任务的。从按Token聊天到现在能完成任务的Agent,想象力空间提升了,但对系统能力要求也变大了,这就是为什么一开始会觉得卡。
作为基础设施厂商,我看到的是机遇和挑战。我们的资源要支撑起这个快速增长的时代。比如我们公司从1月底开始,每两周Token量翻一番。现在的Token用量就像当年100兆手机流量的时代。我们需要更好的优化和整合,让每一个鲜活的人都能用起来。这对整个社区是巨大的优化空间。
罗福莉:我认为openclaw是一个非常革命性和颠覆性的事件。虽然深度Coding的人首选可能还是Code,但用过openclaw的人会感受到它在Agent框架设计上是领先于Code的,Code的最新更新其实都在向openclaw靠近。
它给我的最大价值在于“开源”:这有利于社区深入参与。它把国内次顶级闭源模型的上限拉得非常高,在绝大部分场景下任务完成度已非常接近最新模型,同时又靠Skill体系保证了下限。
此外,它点燃了大家的想象力。大家发现大模型外的Agent层有巨大空间,更多人,不仅是研究员,开始参与AGI变革,这在一定程度上替代了重复工作,释放了时间去做更有想象力的事。
黄超:首先是从交互模式上,openclaw给了大家一种“更有活人感”的体验。之前的Agent工具感更强,而openclaw以“软件切入”的方式,更接近大家想象中的个人贾维斯(J.A.R.V.I.S.)。
其次,它证明了架构Agent的框架可以既简单又高效。它让我们重新思考:是否需要一个All in one的超级智能体,还是需要一个轻量级操作系统或脚手架式的小管家?它让大家更有“玩起来”的心态,撬动生态里的所有工具,通过Skills或Tool的设计,赋能各行各业。
杨植麟:顺着刚才大家一直在讨论 OpenClaw,我也想接着问张鹏一个问题。智谱最近发布了新的GLM Turbo模型,这个模型在相关能力上也做了很大的增强。能否介绍一下新旧模型的不同?以及观察到的提价策略反映了什么市场情况?
张鹏:发布Turbo主要是为了从“简单的对话”转向“干活”。openclaw让大家看到大模型能干活,但干活背后的Token消耗非常高,需要规划、尝试、Debug、处理模糊需求。Turbo在这些方面做了优化,本质上是多智能体协同架构,但在能力上有偏向性加强。
关于提价,因为干活消耗的Token量是简单问答的10倍甚至100倍,成本大幅提高。长期低价竞争不利于行业发展,调整价格是为了回归正常的商业价值,让我们能持续优化模型,提供更好的服务。

杨植麟:小米最近通过发布新模型和开源技术对社区做出了贡献,小米做大模型有什么独特优势?
罗福莉:我想先不谈小米的独特优势,而是谈谈中国大模型团队的优势。
两年前,中国团队在算力受限,尤其是互联带宽受限的情况下,做出了突破:在低端算力限制下,通过模型结构创新(如DPCV3、M1、MA等)去追求最高效率。这给了我们勇气和信心。
虽然现在国产芯片不再受限,但这种对高效率、低推理成本的探索依然重要。例如,现在的Hybrid、SPA、Linear attention结构等。
为什么结构创新重要?因为openclaw越用越聪明的前提是推理Context。现在的难题是:怎么在1M或10M的长上下文下,做到成本够低、速度够快?只有这样,才能激发高生产力任务,实现模型自迭代,在复杂环境中依靠超长Context完成自我进化。
我们现在正在探索Long Context Efficient架构,以及如何在真实长距离任务上做到稳定和高上限。
更长期看,随着推理需求爆发,今年可能增长100倍,竞争维度将下探到算力、推理芯片甚至能源层面。
相关攻略
多地出台政策支持开源AI工具OpenClaw及OPC模式发展。深圳龙岗区推出“龙虾十条”,提供最高千万元补贴;无锡高新区发布12条措施,给予算力补贴和数据支持;常熟市推出13条举措,聚焦垂直领域应用并提供创业生活补贴。各地政策涵盖资金、算力、数据及人才等多方面支持。
360新一代安全大模型正式发布,标志着AI应用进入深度协同新阶段。5月13日,360不仅推出了新一代安全大模型,更同步上线了核心功能“大模型教练”。该系统被定义为运行于安全底座之上的“AI专家团操作系统”,现已全面支持PC、Mac、安卓及iOS平台,用户可即刻下载体验。 区别于传统的单点对话工具,新
全球大模型社区的竞争格局近期出现显著变化。5月9日至12日,开源AI智能体框架Hermes Agent(业内昵称“爱马仕”),在OpenRouter平台的智能体调用量排行榜上连续三天超越此前长期领先的OpenClaw(俗称“龙虾”),引发广泛关注。 这场“爱马仕”与“龙虾”的榜首之争,标志着新一轮“
一、官方 & 完全免费服务商(核心) 1 OpenClaw 开源本体(GitHub) 说到免费,开源社区的力量从来不容小觑。OpenClaw的开源项目,绝对可以称得上是技术自力更生的首选。它的开源内容一应俱全,从核心框架下载、安装指南,到本地部署和一键运行的基础自动化脚本,都为你准备好了。文件操作
1:绕不开的基础依赖:Git 很多朋友在兴致勃勃地准备体验新工具时,第一步就容易被拦下。比如,在确认Node环境正常后,执行安装命令却碰了壁。 C: Users Administrator>npm install -g openclaw@latest npm error code ENOENT np
热门专题
热门推荐
领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。
英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。
微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4
中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。
手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭





