游乐游手机版
首页/AI热点日报/热点详情

DeepSeek-V3.1-Base发布 128K上下文MoE架构性能提升

类型:热点整理2026-05-29
DeepSeek-V3 1-Base在HuggingFace开源,采用MoE架构与128K超长上下文,上线数小时即登顶热门模型榜第二。版本号由日期改为V3 1,延续前代核心设计,在长文档处理等场景表现提升,训练数据与推理效率或有隐藏优化。

DeepSeek-V3.1-Base震撼发布!搭载MoE架构与128K超长上下文,性能全面拉满,AI社区瞬间沸腾。

昨晚,深度求索(DeepSeek)在Hugging Face上悄然开源了全新的基础模型DeepSeek-V3.1-Base。虽然并非大家万众期待的V4,但此次更新足够劲爆——128K超长上下文窗口、MoE混合专家架构,性能再创新高!

DeepSeek-V3.1-Base来了!MoE架构+128K上下文,性能再进化​

有趣的是,这次模型命名方式发生了变化。此前DeepSeek一直采用“V3-0324”这种日期后缀,而此次突然改用“V3.1”版本号,瞬间引发社区热议。官方尚未解释具体原因,但熟悉DeepSeek风格的开发者猜测,这很可能是其“先发模型、后补说明”的一贯操作。

更令人惊叹的是,即便没有官方宣传造势,DeepSeek-V3.1-Base一经发布便展现出惊人热度——上线仅数小时,直接杀入Hugging Face热门模型榜TOP2,DeepSeek在开源社区的超高人气可见一斑。

从目前已披露的信息来看,DeepSeek-V3.1-Base在基础架构上延续了前代V3的核心设计:保持相同参数量级,继续采用混合专家(MoE)模型架构,并在关键性能指标——上下文长度上实现了突破,成功支持128K超长文本处理。尽管官方尚未公布详细技术白皮书,但这一升级意味着模型在长文档理解、代码分析等场景下将具备更强表现力。

话说回来,尽管基础架构相似,但版本号从V3迭代到V3.1显然暗示着某些优化——训练数据、微调策略或推理效率等方面可能进行了隐藏改进。AI社区目前正密切关注后续技术解读,希望弄清楚这次“小版本号大更新”背后的真正门道。

DeepSeek社区地址

更多推荐文章

来源:https://www.53ai.com/news/OpenSourceLLM/2025082008275.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。