DeepSeek发布V3.2大模型,API降价并全面开源
9月29日,DeepSeek正式推出V3.2-Exp实验性模型,该版本已在Huggingface与魔搭平台开源。目前官方App、网页端及小程序都已同步更新至V3.2-Exp版本,同时API服务价格也迎来大幅下调。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,DeepSeek-V3.2-Exp是通向新一代架构的过渡版本。在V3.1-Terminus基础上,该版本创新性地采用了DeepSeek Sparse Attention(DSA)稀疏注意力机制,重点优化了长文本处理时的训练与推理效率。这种细粒度稀疏注意力机制在不影响模型性能的前提下,显著提升了长文本的处理速度。
根据华为官方公众号披露,昇腾计算平台已对vLLM/SGLang等推理框架完成适配部署,实现对DeepSeek-V3.2-Exp的即日支持,并向开发者开源全部推理代码及算子实现。
研发团队表示,新模型开发过程中采用了TileLang高级语言进行快速原型开发,使得探索性研究更加高效。最终开源版本同时包含TileLang和CUDA两种算子实现,建议研究型项目优先使用TileLang版本以便调试和迭代。

随着模型服务成本的大幅降低,DeepSeek对API定价进行了相应调整。新版API调用费用较之前降低了50%以上,为开发者提供了更具性价比的服务选择。

回顾此前进展:8月21日发布的DeepSeek-V3.1首创混合推理架构,支持思考与非思考两种模式,在推理效率和Agent能力方面都有显著提升。9月22日推出的Terminus版本进一步优化了语言一致性和Agent性能,使模型表现更加稳定。
为确保实验可靠性,研发团队特意保持V3.2-Exp与V3.1-Terminus相同的训练设置。经各类公开评测集验证,两个版本在各项性能指标上基本保持相当水平。
相关攻略
特斯拉:TERAFAB项目正式发布,预计将实现每年超1太瓦算力产出3月30日,@TeslaAI 发文称,TERAFAB项目正式发布,预计将实现每年超过1太瓦(1TW)的算力产出。TERAFAB将为特
3月30日,智元机器人宣布第1万台通用具身机器人远征A3在上海正式下线。智元机器人联合创始人、总裁兼CTO彭志辉在接受等媒体采访时表示,下线1万台,意味着智元的本体制造能力,已经完成了从最早的“手工
世界首富马斯克创办的人工智能公司xAI创始团队成员已全部出走。最新消息显示,xAI创始团队中的最后一名联合创始人Ross Nordeen已在上周五离职。Nordeen为马斯克核心运营助手,其离职发生
持续数月走高的内存价格终于迎来回落。从3月下旬,国内市场的内存条价格出现大幅下跌。主流16GB DDR5内存条从2025年12月的1000元高位跌至700元左右;32GB套装更在一个月内缩水27%,
Meta将美国得州AI数据中心投资额增至100亿美元Meta当地时间3月26日宣布,将对美国得州埃尔帕索AI数据中心的投资额增加至100亿美元,目标在该设施预计于2028年投运前达到1吉瓦容量。Me
热门专题
热门推荐
市场情绪与技术指标双重支撑看涨趋势 当前的市场情绪,用一个词概括就是“贪婪”。加密货币恐惧与贪婪指数已经攀升至72的高位,这可不是普通的乐观,而是市场信心正在加速累积的明确信号。 那么,支撑这种乐观情绪的,仅仅是感觉吗?当然不是。把目光投向技术指标,你会发现更系统的证据。在28个常被关注的关键指标中
贺思慕一开始就对段胥充满怀疑,看他哪哪都很奇怪有问题。但又敢凑在他跟前,也敢信任他,帮助他。一个原因是她自己就很厉害,根本不怕他会对她不利。另一个原因也是她懂得洞察人,识人这一块,她一个活了几百年的
在iPhone 15上启用蜂窝移动网络,其实非常简单。核心操作就一步:打开“设置”,进入“蜂窝网络”,然后将“蜂窝数据”的开关打开就行。 iPhone15开启蜂窝数据的详细步骤 新机到手,想立刻用上移动网络?别急,跟着下面的步骤操作,一分钟就能搞定。首先,解锁你的iPhone 15,在主屏幕上找到那
什么是 Aptos 生态系统? 最近,Aptos 生态热闹非凡,活动量激增,这似乎暗示着迷因币市场的风向正在悄然变化。作为一个第一层区块链平台,Aptos 在 Solana、Near Protocol 等一众明星项目中,走出了自己独特的路子。当整个行业都在朝着模块化区块链的方向高歌猛进时,Aptos
什么是背离模式? 在变幻莫测的加密货币市场中,有一种技术分析工具被资深交易者频频提起,那就是背离模式。它之所以重要,是因为能帮你嗅到趋势衰竭或反转的早期气息。掌握它,就如同在波涛汹涌的市场中多了一个可靠的罗盘,不仅能更好地理解行情节奏,还能显著提升交易决策的胜算。 什么是背离模式? 简单来说,背离模





