首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
LongCat-2.0-Preview – 美团推出的万亿参数级大模型预览版

LongCat-2.0-Preview – 美团推出的万亿参数级大模型预览版

热心网友
50
转载
2026-05-06

LongCat-2.0-Preview是什么

最近大模型圈有个消息挺值得关注:美团放出了LongCat-2.0-Preview的内测。这可不是一次普通的版本更新,它有几个标签相当硬核——万亿参数、1M上下文,最关键的是,它完全跑在国产算力上。具体来说,这个预览版采用了MoE架构,总参数量达到了1.6万亿,但每次推理实际激活的参数大约在480亿左右。最引人注目的,莫过于它那百万token级别的超长上下文窗口,这意味着处理整本书、大型代码库都不在话下。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

但真正让它与众不同的,是背后的算力故事。模型的训练和推理全流程,是基于5到6万张国产加速卡完成的,英伟达的算力占比为零。这在业内是头一遭,标志着万亿级大模型的完整闭环首次在国产芯片上被彻底跑通。目前,模型已经开放申请内测,并且大方地给出了每日1000万Token的免费额度,诚意十足。

LongCat-2.0-Preview – 美团推出的万亿参数级大模型预览版

LongCat-2.0-Preview的主要功能

那么,这个“巨无霸”模型到底能干什么?它的能力清单清晰地指向了处理海量信息的场景:

  • 超长上下文理解:1M token的容量,让它能轻松吞下整本书籍、庞大的代码仓库或是长篇累牘的行业报告,进行连贯的分析和理解。
  • 代码生成与推理:得益于MoE架构对专家网络的精准调度,它在编程、数学推理以及需要复杂步骤拆解的指令跟随任务上,表现出了不错的稳定性。
  • 多轮对话与语义检索:通过稀疏注意力机制,模型能在漫长的对话历史中快速定位关键信息,避免了不必要的重复计算,让长程对话更“记事儿”。
  • 多模态内容理解:结合美团在本地生活领域的深厚积累,模型对复杂的业务文档、图文混合内容(比如带有图表的产品说明)的解析能力,预计会是其落地应用的一大亮点。

LongCat-2.0-Preview的技术原理

能达到这样的效果,背后是一系列精巧的工程与算法设计。简单来说,它的技术栈可以概括为“一个核心架构,多项关键创新”。

  • MoE(混合专家)架构:这是实现“大模型、低成本”推理的关键。1.6T的总参数中,每次前向计算只动态激活约48B的参数。门控网络像一位聪明的调度员,根据输入内容实时选择最相关的专家模块参与工作,从而大幅降低了计算开销。
  • N-gram Embedding:这个设计很有意思。团队将部分原本位于专家层的参数前移到了Embedding层,从而引入了词组级别的建模能力。效果就是,许多高频的语言模式可以直接在输入层被匹配命中,无需经过后续复杂的逐层计算,效率提升立竿见影。
  • 稀疏注意力与跨层流感知索引:要处理百万长度的上下文,传统的注意力机制在计算量上是灾难性的。LongCat引入了轻量级的稀疏注意力,并叠加了跨层的语义路径索引,有效避开了全量的O(n²)计算,确保了在超长上下文下,推理延迟依然可控。
  • 确定性算子自研:这是全流程国产化路上必须攻克的堡垒。针对国产芯片生态,团队自研了FlashAttention反向梯度(FAG)、Scatter类算子及GEMM模块等核心组件。最终将性能损失控制在5%左右,确保了在万卡规模的国产集群上进行长时间训练时,结果的可复现性。
  • 显存与通信优化:在国产硬件上训练万亿模型,显存和通信带宽是两大紧箍咒。通过V-ZB算法,训练峰值显存被压缩到了60GB以下。同时,团队重构了专家并行(EP)、张量并行(TP)与流水线并行(PP)策略,使之完美适配国产芯片的带宽与显存约束。

如何使用LongCat-2.0-Preview

如果你对它的能力感兴趣,想亲手试试,目前的路径非常清晰:

  • 申请内测资格:首先,需要访问LongCat开放平台官网,找到内测申请入口,填写并提交你的基本信息等待审核。
  • 等待审核通过:提交后,就进入了审核队列。团队会对申请进行筛选,一旦通过,你会通过邮件或信息收到开通通知。
  • 登录平台获取额度:使用审核通过的账号登录平台,系统会自动为你发放每日1000万Token的免费调用额度,这个起点相当友好。
  • 选择接入方式:你可以直接在提供的Web聊天界面里体验模型能力,也可以根据官方文档的指引,获取API Key,将模型集成到你自己的应用或工作流中。
  • 开始长文本任务:接下来,就是发挥它威力的时候了。在对话框或通过API传入你的长文档、代码库或是复杂的多步指令,模型会基于其强大的1M上下文窗口和MoE专家网络,给出推理结果。

LongCat-2.0-Preview的关键信息和使用要求

为了方便快速查阅,这里将核心信息点汇总如下:

  • 模型名称:LongCat-2.0-Preview
  • 发布方:美团 / LongCat 团队
  • 模型架构:MoE,总参数 1.6T,激活参数 48B
  • 上下文窗口:1M(百万级)token
  • 算力底座:5–6 万张国产加速卡,训推全流程国产化
  • 使用阶段:受邀内测,需申请资格
  • 免费额度:每日 1000 万 Token
  • 硬件要求:用户端无需配置硬件,通过云端 API 或 Web 界面调用

LongCat-2.0-Preview的核心优势

梳理下来,LongCat-2.0-Preview的亮相,至少带来了以下几个维度的突破:

  • 全流程国产自主可控:从训练到推理,完全基于国产芯片实现,真正摆脱了对英伟达CUDA生态的深度依赖。这不仅仅是一个技术选择,更是一次重要的可行性验证——国产算力足以支撑顶级大模型任务。
  • 超长文本能力领先:1M上下文窗口配合高效的稀疏注意力机制,在长文档分析、视频脚本理解、代码库全局分析等场景下,建立了显著的优势壁垒。
  • 推理成本可控:MoE架构本身已经大幅降低了激活参数量,而N-gram Embedding等创新进一步压榨了计算效率。这使得处理相同任务的单位成本,远低于参数规模相当的稠密模型。
  • 工程稳定性强:在万卡级别的国产集群上进行长周期训练,本身就是巨大的工程挑战。通过确定性计算和多层容错恢复体系,其训练稳定性和故障定位能力已经追平国际主流水平。
  • 开源基因深厚:需要留意的是,LongCat团队此前已开源了Flash、Video、Image、AudioDiT等多个项目。因此,2.0版本最终延续开源路线的可能性非常大,这对于开发者生态而言是个积极信号。

LongCat-2.0-Preview的同类竞品对比

要看清一个模型的价值,将其放在市场格局中对比往往更直观。这里我们选取了同样以长上下文和性价比著称的DeepSeek-V4作为参照。

对比维度 LongCat-2.0-Preview DeepSeek-V4
发布方 美团 DeepSeek
总参数量 约 1.6T 万亿级
激活参数 约 48B 未公开具体数值
上下文窗口 1M 1M
训练算力 5–6 万张国产卡,全流程 英伟达 GPU 训练,国产平台推理首发
架构特色 N-gram Embedding + 稀疏注意力 MLA + MoE
国产自主程度 训推全流程国产化,英伟达含量为 0 训练依赖英伟达,推理可跑国产芯片
开源策略 大概率延续开源 已开源
使用成本 内测阶段每日 1000 万免费 Token V4 Flash 0.02 元/百万 Tokens,V4 Pro 0.025 元/百万 Tokens
生态定位 验证国产算力上限,深耕本地生活场景 极致性价比,服务广泛开发者

通过对比不难发现,两者在长上下文赛道正面相遇,但技术路径和战略侧重有所不同。DeepSeek-V4凭借先发开源和极致性价比,快速占领了开发者心智。而LongCat-2.0-Preview则更侧重于展示国产算力全栈能力,并在美团自身的本地生活场景中拥有深厚的落地潜力。

LongCat-2.0-Preview的应用场景

如此强大的能力,最终要落在具体的应用上。以下几个场景,可能是它大展拳脚的地方:

  • 长文档分析与研报生成:金融分析师或研究员可以将百万字级别的市场资料、财报、政策文件一次性输入,要求模型进行摘要提取、核心观点对比,甚至生成初步的深度分析报告。
  • 大型代码库理解与开发:开发者可以直接导入整个GitHub项目仓库,让模型进行跨文件依赖分析、潜在Bug定位,或者根据自然语言描述生成新的功能模块代码。
  • 智能客服与工单处理:在电商、外卖、酒旅等美团优势领域,模型可以基于完整的用户历史订单、聊天记录和投诉链路,提供更精准、连贯的客服支持,提升问题解决效率。
  • 多语言翻译与本地化:利用其长上下文保持术语一致性的能力,可以高效处理整本技术手册、学术著作或影视剧字幕的批量翻译与本地化工作。
  • 教育科研与知识管理:学者或学生可以上传海量的相关文献,让模型快速梳理研究脉络、构建领域知识图谱,并回答那些需要综合多篇论文才能解答的复杂问题。
来源:https://ai-bot.cn/longcat-2-0-preview/
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

LongCat-2.0-Preview – 美团推出的万亿参数级大模型预览版
业界动态
LongCat-2.0-Preview – 美团推出的万亿参数级大模型预览版

LongCat-2 0-Preview是什么 最近大模型圈有个消息挺值得关注:美团放出了LongCat-2 0-Preview的内测。这可不是一次普通的版本更新,它有几个标签相当硬核——万亿参数、1M上下文,最关键的是,它完全跑在国产算力上。具体来说,这个预览版采用了MoE架构,总参数量达到了1 6

热心网友
05.06
战略布局与生态竞争:美团LongCat的‘降维打击’策略
业界动态
战略布局与生态竞争:美团LongCat的‘降维打击’策略

当平台不再只是连接供需,而开始重构生态能力,“降维打击”就不再是口号,而是系统性战略。美团LongCat的出现,标志着平台产品从“工具”走向“生态中枢”的跃迁。本文深度解析LongCat的战略布局与能力迁移路径,揭示其如何在多维竞争中实现生态级突围。 悄然入场,剑指何方?—— LongCat的“非典

热心网友
04.30
美团开源原生多模态大模型LongCat-next:技术架构与应用解析
科技数码
美团开源原生多模态大模型LongCat-next:技术架构与应用解析

3月27日,美团发布并全面开源原生多模态大模型LongCat-Next。该模型打破了当前大模型以“语言为中心”的传统拼凑式架构,将图像、语音与文本统一映射为同源的离散Token。通过纯粹的“下一个

热心网友
03.27
美团LongCat模型:虚拟人视频生成的创新应用与未来
科技数码
美团LongCat模型:虚拟人视频生成的创新应用与未来

北京商报讯(记者 魏蔚)12月18日,美团发布并开源虚拟人视频生成模型 LongCat-Video-Avatar。该模型基于 LongCat-Video,在底层架构上升级实现了动作拟真度、长视频稳定

热心网友
12.19
美团开源LongCat-Video-Avatar模型,支持情感表达虚拟人生成
科技数码
美团开源LongCat-Video-Avatar模型,支持情感表达虚拟人生成

IT之家 12 月 18 日消息,据“龙猫 LongCat”公众号今晚的推文,美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。

热心网友
12.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

商业帝国大亨好玩吗 商业帝国大亨玩法简介
游戏攻略
商业帝国大亨好玩吗 商业帝国大亨玩法简介

商业帝国大亨:一款点击就能征服宇宙的财富游戏? 近期,手游圈的目光似乎被一款名为《商业帝国大亨》的新作吸引了。不少玩家都在询问:这款游戏到底好不好玩?值不值得投入时间?今天,我们就来深入剖析一下它的玩法核心与特色,看看它能否满足你对“商业帝国”的想象。 1 核心玩法评析:从点击屏幕到宇宙财团 如果

热心网友
05.06
异环一咖舍店铺装修方案推荐 店铺经营怎么装修
游戏攻略
异环一咖舍店铺装修方案推荐 店铺经营怎么装修

异环一咖舍店铺装修方案分享:店铺经营怎么装修 在《异环》的世界里,经营自己的店铺无疑是件充满乐趣的事。看着人气攀升、收入增长,那份成就感不言而喻。不过,很多新手玩家容易踏入一个误区:一上来就冲着最华丽的摆件去,结果投入巨大,收益提升却未必理想。今天,我们就来聊聊如何用最精明的策略,搞定你的“一咖舍”

热心网友
05.06
鸣潮3.3版本声骸管理方案推荐 3.3版本声骸管理有没有方案码
游戏攻略
鸣潮3.3版本声骸管理方案推荐 3.3版本声骸管理有没有方案码

鸣潮3 3版本声骸管理方案推荐 随着鸣潮3 3版本的到来,一次全面的声骸系统更新在所难免。特别是针对那些拥有特殊机制的角色,如何高效管理你的声骸库存,成了不少指挥官当前的头等大事。好消息是,新版本支持通过方案码一键导入配置,这无疑大大提升了效率。那么,当前版本有哪些值得关注的方案,又该如何灵活运用呢

热心网友
05.06
梦幻西游175神木怎么配装备
游戏攻略
梦幻西游175神木怎么配装备

梦幻西游神木林175级装备搭配推荐 先来看头盔的选择。这是一件130级的罗汉金钟男头,套装点化成了蜃气妖,并且打上了13锻月亮石。对于神木林这样的法系门派来说,蜃气妖套能直接提升灵力,是核心选择之一。而罗汉金钟这个特技,在高端任务和PK中的重要性不言而喻,关键时刻一个罗汉,往往能扭转战局。用高锻数的

热心网友
05.06
梦幻西游175级魔王怎么搭配装备
游戏攻略
梦幻西游175级魔王怎么搭配装备

梦幻西游魔王寨175装备搭配推荐 先来看头盔的选择。一件160级附带光辉之甲特技、且激活了长眉灵猴套装效果的头盔,无疑是法系门派的上乘之选。更难得的是,它还额外附加了4 58%的法术暴击伤害属性。为了最大化生存能力,这颗头盔被打上了16锻月亮石,将防御堆砌到了一个相当可观的程度。对于追求极致输出的魔

热心网友
05.06