DeepSeek-V3.1-Base发布 128K上下文MoE架构性能提升_AI热点日报

DeepSeek-V3.1-Base发布 128K上下文MoE架构性能提升

类型：热点整理2026-05-29

DeepSeek-V3 1-Base在HuggingFace开源，采用MoE架构与128K超长上下文，上线数小时即登顶热门模型榜第二。版本号由日期改为V3 1，延续前代核心设计，在长文档处理等场景表现提升，训练数据与推理效率或有隐藏优化。

DeepSeek-V3.1-Base震撼发布！搭载MoE架构与128K超长上下文，性能全面拉满，AI社区瞬间沸腾。

昨晚，深度求索（DeepSeek）在Hugging Face上悄然开源了全新的基础模型DeepSeek-V3.1-Base。虽然并非大家万众期待的V4，但此次更新足够劲爆——128K超长上下文窗口、MoE混合专家架构，性能再创新高！

DeepSeek-V3.1-Base来了！MoE架构+128K上下文，性能再进化

有趣的是，这次模型命名方式发生了变化。此前DeepSeek一直采用“V3-0324”这种日期后缀，而此次突然改用“V3.1”版本号，瞬间引发社区热议。官方尚未解释具体原因，但熟悉DeepSeek风格的开发者猜测，这很可能是其“先发模型、后补说明”的一贯操作。

更令人惊叹的是，即便没有官方宣传造势，DeepSeek-V3.1-Base一经发布便展现出惊人热度——上线仅数小时，直接杀入Hugging Face热门模型榜TOP2，DeepSeek在开源社区的超高人气可见一斑。

从目前已披露的信息来看，DeepSeek-V3.1-Base在基础架构上延续了前代V3的核心设计：保持相同参数量级，继续采用混合专家（MoE）模型架构，并在关键性能指标——上下文长度上实现了突破，成功支持128K超长文本处理。尽管官方尚未公布详细技术白皮书，但这一升级意味着模型在长文档理解、代码分析等场景下将具备更强表现力。

话说回来，尽管基础架构相似，但版本号从V3迭代到V3.1显然暗示着某些优化——训练数据、微调策略或推理效率等方面可能进行了隐藏改进。AI社区目前正密切关注后续技术解读，希望弄清楚这次“小版本号大更新”背后的真正门道。

DeepSeek社区地址

更多推荐文章

来源：https://www.53ai.com/news/OpenSourceLLM/2025082008275.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。