美团LongCat-2.0万亿参数大模型预览版发布
最近大模型圈有个消息挺值得关注:美团放出了LongCat-2.0-Preview的内测。这可不是一次普通的版本更新,它身上带着几个相当醒目的标签——万亿参数、MoE架构,以及最关键的,完全跑在国产算力上的训推闭环。咱们今天就把它掰开揉碎了看看。
简单来说,LongCat-2.0-Preview是美团大模型家族的最新预览版。它的总参数量达到了1.6万亿,但别被这个数字吓到,它采用了混合专家(MoE)架构,每次推理实际激活的参数大概在480亿左右。这就像拥有一座巨大的图书馆,但每次只根据你的问题,从最相关的几个书架上取书,效率自然高得多。
它最引人注目的能力,是支持高达100万token的超长上下文。这意味着什么?整本书、大型代码库、甚至长篇累牍的行业报告,都可以一次性“喂”给它。当然,光有容量还不够,还得能“消化”。为此,团队在注意力机制上做了稀疏化处理,确保在处理如此长的文本时,响应速度依然可控。
不过,真正让它与众不同的,或许是技术路线上的选择。根据公开信息,模型的训练和推理全程基于5到6万张国产加速卡完成,英伟达算力的占比是零。这在业内算是首次,验证了国产芯片集群从训练到推理完整支撑万亿级大模型的可行性。目前模型已经开放内测申请,成功参与的用户每天能获得1000万token的免费额度,这个手笔不算小。
它能做什么?不止是“更长”
参数和架构是骨架,功能才是血肉。LongCat-2.0-Preview的能力可以归结为几个核心方向:
- 超长文本的深度处理:这是它的招牌。无论是消化一整本小说来分析人物关系,还是通读一个开源项目的所有代码来理解架构,它都能胜任。
- 复杂的代码与逻辑推理:MoE架构允许它动态调度最擅长的“专家”网络来处理编程、数学这类需要精准逻辑的任务,表现更加稳定。
- 连贯的多轮对话与精准检索:借助稀疏注意力,它能在漫长的对话历史中快速定位关键信息,避免在无关内容上消耗算力,让对话更连贯、更“记事儿”。
- 理解图文混合的复杂内容:结合美团在本地生活领域的深厚积累,模型对包含图表、格式文本的业务文档有不错的解析能力。
技术底牌:如何驾驭万亿参数?
要实现上述能力,背后是一系列精巧的技术设计。简单看看它的几项核心技术:
- MoE(混合专家)架构:这是控制成本的关键。1.6T的总参数中,每次前向计算只激活约48B,通过一个“门控”系统动态选择最相关的专家模块。
- N-gram Embedding:这是个有趣的创新。它将部分原本在深层网络处理的参数,“前移”到了词嵌入层,直接对词组进行建模。高频的语言模式可以在这里直接匹配命中,减少了一层层的计算开销。
- 稀疏注意力与跨层索引:为了应对百万级上下文带来的平方级计算复杂度,模型引入了轻量的稀疏注意力机制,并结合跨层的语义路径索引,只关注最相关的信息片段。
- 为国产芯片定制的算子:要完全脱离英伟达生态,自研核心算子是必经之路。团队针对国产芯片,自研了FlashAttention反向梯度、Scatter类算子及GEMM模块,将性能损失控制在5%左右,确保了万卡集群长期训练的稳定性和可复现性。
- 极致的显存与通信优化:通过名为V-ZB的算法,将训练峰值显存压缩到60GB以下。同时,重构了专家并行、张量并行与流水线并行的策略,以适应国产芯片的带宽和显存限制。
如何上手体验?
如果你对这款模型感兴趣,目前的体验路径大致如下:
- 申请内测资格:访问LongCat开放平台官网,找到内测申请入口,填写必要信息提交。
- 等待审核:提交后,团队会对申请进行审核,通过后会通过邮件或信息通知。
- 登录获取额度:使用审核通过的账号登录平台,系统会自动发放每日1000万token的免费调用额度。
- 选择使用方式:你可以直接在Web聊天界面体验,也可以根据文档获取API Key,将其集成到自己的应用或工作流中。
- 开始长文本任务:在对话框或通过API输入你的长文档、代码或复杂指令,模型会基于其百万级上下文窗口和专家网络给出结果。
关键信息一览
- 模型名称:LongCat-2.0-Preview
- 发布方:美团 / LongCat 团队
- 模型架构:MoE,总参数1.6T,激活参数48B
- 上下文窗口:1M(百万级)token
- 算力底座:5–6万张国产加速卡,训推全流程国产化
- 使用阶段:受邀内测,需申请资格
- 免费额度:每日1000万Token
- 硬件要求:用户端无需配置硬件,通过云端API或Web界面调用
它的核心优势在哪里?
在竞争激烈的大模型赛道,LongCat-2.0-Preview试图建立自己的差异化优势:
- 全流程自主可控的象征意义:从训练到推理完全基于国产芯片,这不仅仅是技术验证,更是在当前环境下的一条重要技术路径探索,证明了国产算力具备支撑顶级大模型任务的能力。
- 超长文本处理的实际领先:1M上下文配合高效的稀疏注意力机制,在长文档分析、视频脚本理解、代码库管理等场景下,能提供更连贯、更深入的分析能力。
- 更具性价比的推理成本:MoE架构本身已大幅降低激活参数,N-gram Embedding等技术进一步压低了计算量,使得处理相同任务的成本远低于参数规模相近的稠密模型。
- 工程稳定性的深厚功底:在万卡级别的国产集群上实现长周期稳定训练,故障定位和复现能力追平国际水平,这背后是极强的工程化能力。
- 开源基因带来的生态想象:LongCat团队此前已开源多个项目,其2.0版本很大概率会延续开放路线,这对于开发者生态的构建至关重要。
与同类模型的横向对比
要看清一个模型的位置,最好的办法是把它放在赛场里。我们选取了同样以“长上下文”和“高性价比”著称的DeepSeek-V4作为参照,来看看它们的异同。
| 对比维度 | LongCat-2.0-Preview | DeepSeek-V4 |
|---|---|---|
| 发布方 | 美团 | DeepSeek |
| 总参数量 | 约 1.6T | 万亿级 |
| 激活参数 | 约 48B | 未公开具体数值 |
| 上下文窗口 | 1M | 1M |
| 训练算力 | 5–6 万张国产卡,全流程 | 英伟达 GPU 训练,国产平台推理首发 |
| 架构特色 | N-gram Embedding + 稀疏注意力 | MLA + MoE |
| 国产自主程度 | 训推全流程国产化,英伟达含量为 0 | 训练依赖英伟达,推理可跑国产芯片 |
| 开源策略 | 大概率延续开源 | 已开源 |
| 使用成本 | 内测阶段每日 1000 万免费 Token | V4 Flash 0.02 元/百万 Tokens,V4 Pro 0.025 元/百万 Tokens |
| 生态定位 | 验证国产算力上限,深耕本地生活场景 | 极致性价比,服务广泛开发者 |
从对比中可以看出,两者在长上下文能力上旗鼓相当,但技术路线和生态定位差异明显。LongCat更侧重于验证全流程国产化的技术上限,并可能更深度结合美团的本地生活场景;而DeepSeek-V4则已在开源和极致性价比的路径上取得了显著进展。
潜在的应用场景展望
如此强大的长文本和理解能力,能用在哪些地方?想象空间很大:
- 长文档分析与研报生成:金融分析师可以将百万字的公司年报、行业资料一次性输入,快速获得摘要、风险点对比和深度分析报告。
- 大型代码库理解与开发辅助:开发者可以让模型通读整个项目仓库,完成跨文件依赖分析、自动化代码审查,甚至根据注释生成新的功能模块。
- 智能客服与复杂工单处理:在电商、外卖等场景,模型可以基于完整的用户历史订单、聊天记录和投诉链路,提供更精准、连贯的解决方案,无需用户反复陈述。
- 高质量的多语言翻译与本地化:利用长上下文保持专业术语和文风的一致性,非常适合整本技术手册、学术著作或影视剧本的批量翻译与本地化。
- 教育科研与知识管理:学者可以上传海量文献,让模型帮助梳理研究脉络、对比不同观点,甚至回答跨越多篇论文的综合性问题,加速科研进程。
总的来说,LongCat-2.0-Preview的亮相,不仅是在参数和长度上的一次冲刺,更是在大模型国产化技术路径上的一次重要实践。它的后续发展,无论是性能表现、开源策略还是生态建设,都值得持续关注。
相关攻略
4月24日,《科创板日报》的一则独家报道,再次引爆了国内人工智能与大型语言模型领域的关注。报道披露,美团自主研发的新一代基础大模型——LongCat-2 0-Preview,已悄然启动邀请制内测。最令业界瞩目的是,该模型的参数总量已确认突破万亿级别,这标志着美团大模型正式迈入全球顶尖AI模型的“万亿
美团LongCat团队开源了通用推理评测基准General365。该基准包含365道人工设计的种子题及其变体,覆盖八大推理维度,并将知识背景限定于中小学水平以纯粹考察逻辑能力。在26款主流大模型测试中,仅一款准确率略超60%,揭示了模型在通用推理上的普遍短板。基准采用混合评分与半公开策略确保评估科学可靠。
想象一下,要让一个团队变得更聪明,你会怎么做?常规思路或许是招募更多专家。但美团LongCat团队在2026年1月发表的一项研究(arXiv:2601 21204v1),却指出了一个更巧妙的路径:与其不断扩充“专家”数量,不如先升级整个团队的“沟通词汇库”。这项发现,为大型语言模型(LLM)的演进打
LongCat-2 0-Preview是什么 最近大模型圈有个消息挺值得关注:美团放出了LongCat-2 0-Preview的内测。这可不是一次普通的版本更新,它有几个标签相当硬核——万亿参数、1M上下文,最关键的是,它完全跑在国产算力上。具体来说,这个预览版采用了MoE架构,总参数量达到了1 6
当平台不再只是连接供需,而开始重构生态能力,“降维打击”就不再是口号,而是系统性战略。美团LongCat的出现,标志着平台产品从“工具”走向“生态中枢”的跃迁。本文深度解析LongCat的战略布局与能力迁移路径,揭示其如何在多维竞争中实现生态级突围。 悄然入场,剑指何方?—— LongCat的“非典
热门专题
热门推荐
为庆祝成立50周年,苹果在全球多地门店举办系列庆祝活动。最盛大的庆典在其总部ApplePark举行,员工齐聚草坪,传奇音乐人保罗·麦卡特尼登台献唱,首席执行官蒂姆·库克也参与其中。这场科技与艺术交融的盛会,既是对过往传奇的致敬,也寓意着新篇章的开启。
苹果公司成立五十周年之际,首席执行官蒂姆·库克发布内部信回顾历程。信中指出,公司从车库中的一台原型机起步,如今全球活跃设备已达25亿台。库克强调,未来需主动创造而非等待,并鼓励员工铭记创新精神,共同把握机遇,开创下一个五十年。
苹果CEO库克在专访中回顾了iPod的诞生历程。该产品以口袋装千首歌的能力革新了音乐消费方式。其爆红要求苹果在三个月内生产约1500万台,这极大考验了供应链。此次极限压力测试为苹果锻造出世界级供应链能力奠定了基础。库克还透露,首台原型机播放的第一首歌是《HeyJude》。
知名投资人段永平家族办公室持仓市值升至约200亿美元。本季度清仓阿里,减持苹果、台积电;重仓AI与电动车赛道,大幅增持英伟达并新建仓特斯拉,拼多多获增持。其首次跨足Web3领域,建仓稳定币发行商Circle,显示对合规区块链基础设施的关注。
Mac内置的“缩放”辅助功能可放大屏幕细节。通过系统设置开启该功能后,可选择画中画或全屏模式。用户可使用修饰键配合触控板手势、快捷键组合、双击Control+Option或鼠标智能缩放等多种方式灵活操作,满足不同场景下的查看需求。





