游乐游手机版
首页/科技数码/文章详情

DeepSeek发布新模型,8000mAh续航144Hz屏手机

时间:2025-12-10 12:05
梁文锋最新动作来了,DeepSeek-V3 2-Exp今天正式发布并开源。根据DeepSeek最新介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。V3 2-Exp在

梁文锋最新动作来了,DeepSeek-V3.2-Exp今天正式发布并开源。

根据DeepSeek最新介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek稀疏注意力(Sparse Attention)机制,旨在对长文本的训练和推理效率进行探索性的优化和验证。

对于此次模型更新,中信建投TMT行业首席分析师武超则评价,DeepSeek-V3.2-Exp“易用性再次大幅提升”。

值得一提的是,除了英伟达CUDA版本外,DeepSeek还开源了TileLang版本GPU算子。

目前,最新App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

在缓存命中的情况下,输入价格由0.5元/百万token降低为0.2元。在缓存未命中的情况下,输入价格由4元/百万token减低为2元。输出价格则从12元/百万token大幅降低为3元。

在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

据介绍,该实验版本代表了DeepSeek对更高效的transformer架构的研究,特别注重提高处理扩展文本序列时的计算效率。

DeepSeek稀疏注意力架构(DSA)首次实现了细粒度(fine-grained)稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长文本训练和推理效率。

为了评估引入稀疏注意力机制的影响,DeepSeek方面特意将DeepSeek-V3.2-Exp的训练配置与V3.1-Terminus进行了对齐。在各个领域的公开基准测试中,DeepSeek-V3.2-Exp的表现与V3.1-Terminus相当。

DeepSeek方面称,在新模型的研究过程中,需要设计和实现很多新的GPU算子。

“我们使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含TileLang与CUDA两种版本。我们建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。”

《科创板日报》了解到,TileLang编程语言是由北京大学计算机学院副研究员杨智团队主导开发的开源AI算子编程语言。在华为全联接大会上,该团队核心成员董宇骐曾介绍,TileLang实现了FlashAttention算子开发,代码量从500+行减少至80行,并保持了与手机游戏本持平的性能。

除了DeepSeek外,近期阿里通义千问、智谱也都在推进大模型的迭代升级。

在2025云栖大会现场,阿里云接连发布了七款大模型技术产品,覆盖语言、语音、视觉、多模态、代码等模型领域。其中包括了阿里旗舰模型Qwen3-Max正式发布,预训练数据量达36T,总参数超过万亿,在Coding编程能力和Agent工具调用能力上有较大提升。

智谱新模型GLM-4.6将于近日发布,目前已可通过API接口调用。

月之暗面Kimi则发布Agent模式“OK Computer”并开启灰度测试。据最新介绍,“OK Computer”延续“模型即Agent”理念,通过端到端训练Kimi K2模型,进一步提升智能体及工具调用能力。

AI原生产品日报频道: 前沿科技
来源:https://www.huxiu.com/article/4787095.html
上一篇Meta专家分享AI应用增长实战指南 下一篇玻璃基板技术突破,商业化进程提速
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
小米米家无线吸尘器4 Max 280AW强劲吸力180°蓝光显尘
科技数码 · 2026-05-30

小米米家无线吸尘器4 Max 280AW强劲吸力180°蓝光显尘

小米米家无线吸尘器4Max正式开售,首发到手价2045 37元,享受国家补贴后仅1738 56元。其核心搭载800W无刷电机,提供280AW强劲吸入功率,配备180°蓝光显尘功能,采用双风道集尘设计,智能集尘可实现100天免倒尘。全链路8重精滤,一机五用,90分钟长续航,并支持米家生态联动。

迈从A7 V3 Ultra+鼠标开售,PAW3955传感器首发319元
科技数码 · 2026-05-30

迈从A7 V3 Ultra+鼠标开售,PAW3955传感器首发319元

迈从A7V3Ultra+鼠标开售,首发319 55元。自研猎影方案与双54L芯片,原生双8K;PAW3955TI传感器可超频至50000DPI。重59g,四种配色,SuperGlide玻璃涂层2 0,配RGB无线充底座。

荣耀Earbuds S2耳机299元42dB主动降噪45小时续航
科技数码 · 2026-05-30

荣耀Earbuds S2耳机299元42dB主动降噪45小时续航

荣耀EarbudsS2入耳式耳机299元首销,具备42dB深度主动降噪、45小时总续航、12 4mm动圈单元及AI通话降噪,支持智能弹窗与IP54防水,精致外观打造沉浸影音体验。

三星全球首发12层HBM4E内存样品 进一步发力AI市场
科技数码 · 2026-05-30

三星全球首发12层HBM4E内存样品 进一步发力AI市场

三星交付首款12层HBM4E样品,单颗48GB,速率16Gbps,带宽3 6TB s,采用第六代10纳米级DRAM与4纳米逻辑工艺,能效提升16%,热阻改善14%,面向AI与大型语言模型。

华硕天选7标准版全新上架 锐龙7 H260配RTX 5050/5060 16G+512G售价7999元起
科技数码 · 2026-05-30

华硕天选7标准版全新上架 锐龙7 H260配RTX 5050/5060 16G+512G售价7999元起

5月30日消息,华硕天选7标准版已经在京东上架并开启预约,6月1日正式开售。这台机器最大的看点,是处理器升级为AMD锐龙7 H 260,提供了几个不同配置的SKU。价格和配置细节如下: RTX 5050显卡、16GB内存、512GB固态硬盘、日蚀灰配色:7999元,叠加上国补后6799元; RTX