DeepSeek-V3.1 开源发布:685B参数大模型,128K上下文突破长文本极限
8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 685B。

附开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
而在昨晚早些时候,DeepSeek 发布通知称,线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。
需要注意的是,大家期待已久的 DeepSeek R2 仍没有确定的发布时间。
相关攻略
DeepSeek启动融资,阿里因追求深度生态绑定而退出,腾讯则以小额财务投资有望入局。这折射出两家巨头迥异的AI战略:阿里倾向于通过投资进行技术整合与控制,腾讯则保持开放生态,不干预技术路线。与此同时,字节选择重金自研,全力押注C端入口。三家公司的不同选择源于各自的企业基因与资源
近日,AI开发者社区与多个技术论坛中,一则关于DeepSeek API模型能力疑似升级的消息引发了广泛关注。多位开发者在社交媒体及技术交流群中反馈,通过API调用的模型参数出现了显著变化:上下文处理长度从原先的128K大幅提升至一百万tokens,同时知识截止日期也从2024年更新至2025年5月。
DeepSeek近期在GitHub上动作频频,技术开源步伐明显加快。继不久前低调更新Mega MoE和FP4 Indexer后,团队近日又重磅开源了全新的Tile Kernels代码库,并对DeepEP专家并行框架进行了重要版本迭代,发布了性能大幅提升的DeepEP V2。 Tile Kernels
北京时间4月24日,《金融时报》的一则报道,揭开了AI明星公司DeepSeek首次寻求外部融资的幕后考量。与外界想象中为“烧钱”续命不同,这次融资的核心目的颇为独特:留住人才。 图注:DeepSeek 据两位接近交易的人士透露,DeepSeek正在与一小群战略投资者接触,洽谈新一轮融资。这轮融资如果
4月24日,AI行业迎来重大突破:深度求索公司正式发布并开源了其新一代大语言模型DeepSeek-V4的预览版。 此次发布的亮点极为突出。官方资料显示,DeepSeek-V4不仅拥有处理百万字级超长文本的上下文能力,更在智能体(Agent)功能、世界知识整合以及复杂推理性能等多个核心指标上,达到了国
热门专题
热门推荐
在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过
你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整
如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏
当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围
当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓





