美团开源560B参数LongCat大模型,AI智能体任务表现优异
特别鸣谢网友蔡蔡Cai、小星_14、Domado、有鲫雪狐提供的线索资讯!
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
9月1日最新消息,美团今日正式推出LongCat-Flash-Chat模型并同步开放源代码。
LongCat-Flash采用创新的混合专家模型架构,总参数量达到560B,实际激活参数在18.6B至31.3B之间波动,平均值为27B,在计算效率与性能表现之间取得最优平衡。
该模型在架构设计上引入“零计算专家”机制,总参数量达560B,每个token根据上下文需求仅激活18.6B~31.3B参数,实现算力资源的精准调配。为有效控制整体算力消耗,训练过程中采用PID控制器动态调节专家偏置,将单token平均激活参数量稳定维持在27B左右。
此外,模型在层级间构建跨层通信通道,使MoE的通信与计算流程实现高度并行,极大提升了训练与推理效率。配合深度定制的底层优化方案,LongCat-Flash仅用30天便完成训练,在H800硬件平台上实现单用户每秒100+ tokens的推理速度。该模型还对常规大模型组件与训练方法进行了多项改进,采用超参迁移与模型层叠加的训练策略,并结合多种技术手段确保训练过程的稳定性。
针对智能体功能优化,LongCat-Flash自主构建了Agentic评估体系以指导数据策略,并在全训练流程中实施全面优化,包括运用多智能体方法生成丰富多样的高质量轨迹数据,从而显著提升了智能体任务的处理能力。
通过算法与工程设计的深度融合,LongCat-Flash在理论成本与运行速度方面均显著超越同规模甚至更小规模的行业竞品;经过系统级优化,该模型在H800平台上达成每秒100 tokens的生成速度,在保持极致生成效率的同时,将输出成本控制在每百万token仅5元。
综合多项基准测试评估,作为非思考型基础模型,LongCat-Flash-Chat在仅激活少量参数的情况下,性能表现已与当前主流领先模型持平,尤其在智能体任务领域展现出显著优势。得益于面向推理效率的专项设计与创新,LongCat-Flash-Chat具备更快的推理速度,特别适合处理耗时长、复杂度高的智能体应用场景。
- 在通用领域知识方面,LongCat-Flash在ArenaHard-V2基准测试中获得86.50分,位列所有参评模型第二名。在基础能力测试中,MMLU得分为89.71,CEval得分达90.44。这些成绩与国内顶尖模型表现相当,但其参数规模明显小于DeepSeek-V3.1、Kimi-K2等同类产品。
- 在智能体工具使用领域,LongCat-Flash展现出卓越性能:即使在面对参数规模更大的竞品时,其在τ2-Bench中的表现依然领先;在复杂场景处理能力方面,该模型于VitaBench测试中以24.30的得分高居榜首。
- 在编程能力测试中,LongCat-Flash在TerminalBench评估中以39.51分位列第二;在SWE-Bench-Verified测试中取得60.4分的优异成绩。
- 在指令遵循维度,LongCat-Flash在IFEval测试中以89.65分夺得第一;同时在COLLIE和Meeseeks-zh两项中文指令基准测试中分别获得57.10和43.03的最高分,彰显其在中英文不同语言环境及高难度指令集上的卓越适应能力。
目前,LongCat-Flash-Chat已在GitHub与Hugging Face平台同步开源。具体访问地址如下:
- Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-Chat
- GitHub:https://github.com/meituan-longcat/LongCat-Flash-Chat
- 体验官网:https://longcat.ai/
热门专题
热门推荐
任天堂吉祥物马里奥的宿敌酷霸王解析:为何这位反派深受喜爱?宫本茂通过电影揭示角色深层魅力 谈到任天堂的经典形象,马里奥与酷霸王这对宿敌的组合可谓深入人心。一边是永不放弃拯救碧姬公主的英雄,另一边则是不断制造混乱的恶棍,故事框架虽简单却历经三十余年依然人气不减。但仔细品味,酷霸王这个角色颇为值得玩味:
洛克王国神圣狮鹫图鉴:揭秘悬崖之王的飞行奥秘 当冒险者们踏上洛克王国的高耸悬崖,便能感受到猛烈的疾风。呼啸而过的气流远超平地的强度,然而正是这片常年不息的风域,成为了狮鹫一族最卓越的自然训练场。在这个独特的环境中,它们锤炼出了对抗强风与复杂气流的顶级飞行技巧,其背后的生存智慧,实在值得探险者们深入探
4月2日消息,三星电子最新表示,自2019年起连续七年位居全球第一。根据三星援引的市场调研公司IDC数据,2025年三星电子在全球游戏电竞显示器市场的收入占比达到18 9%。从销量来看,2025年三
内存市场因为人工智能高带宽内存的蓬勃需求而陷入供应紧张,传统内存也因大量产线被占用而供不应求。在这种大背景下,苹果似乎采取了一种争议性的商业手段,来进一步扩大其市场份额。据韩国消息人士透露,苹果公司
4月6日消息,近期内存市场风声鹤唳,现货价格小幅回调就引发了内存价格崩盘”的论调,甚至带动相关个股集体下跌,但行业龙头三星却完全不为所动,反而按计划继续上调DRAM内存产品价格,用实际行动打破了市场





