游乐游手机版
首页/AI热点日报/热点详情

DeepSeek开源模型实力解析:成本暴降,性能比肩GPT-5与Gemini 3 Pro

类型:热点整理2025-12-02
目前,最新网页端、App 和 API 均已更新为正式版 DeepSeek-V3 2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。 出品 | 51CTO技术栈(微信号

目前,DeepSeek-V3.2 正式版已经全面覆盖网页端、App 和 API 服务。而 Speciale 版本目前仅提供临时 API 服务,旨在邀请社区参与测试与研究。

出品 | 51CTO技术栈(微信号:blog51cto)

突破性发布!

DeepSeek 正式推出两款新模型:

· DeepSeek-V3.2:这款模型在推理能力与输出长度之间取得了平衡,非常适合日常使用场景,比如问答对话和通用 Agent 任务处理。在公开的推理类 Benchmark 测试中,V3.2 的表现已经达到 GPT-5 同等水平,仅略逊于 Gemini-3.0-Pro;相较于 Kimi-K2-Thinking,V3.2 的输出长度大幅缩减,显著降低了计算开销与用户等待时间。

· DeepSeek-V3.2-Speciale:作为 V3.2 的深度思考增强版本,它不仅具备出色的指令跟随能力,还展现出严谨的数学证明与逻辑验证水平,其推理性能足以媲美 Gemini-3.0-Pro。该模型已成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)以及 IOI 2025(国际信息学奥林匹克)金牌。

DeepSeek-V3.2 架构上最大的创新在于引入了 DSA(DeepSeek Sparse Attention)机制。这项技术有效降低了计算复杂度,使模型在处理长上下文任务时能够显著加速推理过程,且不会造成明显的性能损失。

同时,模型还支持 FP8 精度,并适配了 MLA(Multi-Query Attention)架构,使训练过程更加高效稳定。

网友们如何看待这次发布?今晚的讨论主要聚焦在两个方面:

一是“V3.2 居然能和 GPT-5 平分秋色?”这成为许多用户的第一反应:“国内模型第一次真正意义上与 GPT-5 同台竞技。”尤其在推理这个最具挑战性、投入成本最高的技术领域实现突破,更让人印象深刻。

二是“成本控制太关键了”——V3.2 在保持同等推理能力的前提下实现了更优的成本效益,引发网友感叹:“如果你的能力相当,但一张卡能顶别人三张卡,那你就赢了。”“OpenAI 还在烧钱,DeepSeek 已经在省钱路上越跑越快。”

业界形成的共识是:DeepSeek 此次并非单纯升级模型,而是在推理原生能力上又将行业向前推进了一步。

目前,最新网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本当前仅以临时 API 服务形式开放,以供社区评测与研究。

欢迎大家尽快去体验!

最后附上开源链接:https://huggingface.co/deepseek-ai/DeepSeek-V3.2

来源:https://www.51cto.com/article/830902.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。