11月4日最新消息,美团LongCat(龙猫)团队昨日正式推出全新开源大模型LongCat-Flash-Omni。
这款模型的总参数量高达5600亿,实现了全模态能力突破,在开源领域达到业界最先进水平(SOTA)。

今年9月1日,美团正式发布了LongCat-Flash系列模型,并开源了LongCat-Flash-Chat和LongCat-Flash-Thinking两大版本。
此次推出的LongCat-Flash-Omni是该系列的全新成员。它也是业界首个实现"全模态覆盖、端到端架构、大参数高效推理"三位一体的开源大语言模型,首次在开源范畴内实现了全模态能力对闭源模型的全面对标。

该模型的核心突破在于成功破解了"大参数与高效率"这一行业难题。
虽然模型总参数量达到5600亿(激活参数270亿),但依托LongCat-Flash系列创新的ScMoE架构(含零计算专家)作为LLM骨干,结合高效多模态编解码器和"分块式音视频特征交织机制",最终实现了低延迟、高质量的音视频处理与流式语音生成。
模型支持128K tokens上下文窗口及超过8分钟音视频交互,在多模态长时记忆、多轮对话、时序推理等能力上具备显著优势。

实测数据显示,其图像理解性能与闭源全模态模型Gemini-2.5-Pro相当,且优于开源模型Qwen3-Omni。短视频理解性能超越同类模型,长视频处理能力比肩Gemini-2.5-Pro。
在落地体验方面,LongCat最新App现已正式发布,支持联网搜索功能,还可以发起语音通话(视频通话功能敬请期待)。

