美团开源LongCat-Flash-Omni：5600亿参数，行业领先水平

11月4日消息，昨日，美团LongCat（龙猫）团队正式推出全新开源大模型LongCat-Flash-Omni。该大模型总参数规模高达5600亿，实现全模态能力突破，登顶开源领域最先进水平（SOTA

11月4日，美团LongCat（龙猫）团队正式发布了全新的开源大模型LongCat-Flash-Omni。

该模型参数规模高达5600亿，实现了全模态能力突破，登顶开源领域最先进（SOTA）水平。

美团发布LongCat-Flash-Omni：总参数达5600亿开源最先进水平

今年9月1日，美团首次推出LongCat-Flash系列模型，并开源了LongCat-Flash-Chat和LongCat-Flash-Thinking两大版本。

此次发布的LongCat-Flash-Omni是该系列的全新成员。它也是业界首个实现"全模态覆盖、端到端架构、大参数高效推理"于一体的开源大语言模型，首次在开源范围内实现了全模态能力对标闭源模型。

美团发布LongCat-Flash-Omni：总参数达5600亿开源最先进水平

该模型的核心突破在于破解了"大参数与高效率"的行业矛盾。

虽然模型总参数量达到5600亿（激活参数270亿），但其依托LongCat-Flash系列创新的ScMoE架构（含零计算专家），作为大语言模型骨干，结合高效多模态编解码器和"分块式音视频特征交织机制"，最终实现了低延迟、高质量的音视频处理与流式语音生成。

模型支持128K tokens上下文窗口及超过8分钟音视频交互，在多模态长时记忆、多轮对话、时序推理等能力上具备显著优势。

美团发布LongCat-Flash-Omni：总参数达5600亿开源最先进水平

实测显示，其图像理解性能与闭源全模态模型Gemini-2.5-Pro相当，且优于开源模型Qwen3-Omni。短视频理解性能超越同类模型，长视频处理能力比肩Gemini-2.5-Pro。

在落地体验上，LongCat最新App现已正式发布，支持联网搜索，还可以发起语音通话（视频通话功能敬请期待）。

美团发布LongCat-Flash-Omni：总参数达5600亿开源最先进水平