游乐游手机版
首页/手机教程/文章详情

DeepSeek-模型(model)介绍

时间:2025-04-23 19:01
我们已经部署过windows版本、linux版本、单机版本和集群版本,并且在过程中使用了多个模型。那么,这个模型到底是什么呢?你可以选择哪些模型呢?什么是蒸馏版、满血版和量化版呢?

我们已经部署过windows版本、linux版本、单机版本和集群版本,并且在过程中使用了多个模型。那么,这个模型到底是什么呢?你可以选择哪些模型呢?什么是蒸馏版、满血版和量化版呢?

首先,我们需要理解什么是训练模型和推理模型。

训练模型

训练模型是指模型在学习阶段的过程。在这一阶段,模型通过大量标注数据(输入数据和对应的标签/答案)逐步调整内部参数(如神经网络的权重),目标是学习数据中的规律,从而能够对未知数据做出预测或分类。

国产大模型DeepSeek之所以火爆,是因为它以较低的成本(500万美元以上)训练出的模型达到了ChatGPT等闭源模型的性能。DeepSeek将训练的模型开源并允许商用,目前国内许多厂商都使用DeepSeek的67B模型来供普通用户使用。

注:这里的B指的是参数,参数越大,代表能力越强,一个B代表10亿参数。

推理模型

推理模型是指训练完成后,模型应用阶段的过程。此时模型参数已固定,用于对新的输入数据(未见过的数据)进行预测或分类。我们前面搭建的所有大模型都是使用DeepSeek开源的模型搭建的。

蒸馏模型

DeepSeek到目前为止开源的模型有多个,其中最火爆的是DeepSeek-R1,因为它不仅发布了67B的满血版,还发布了蒸馏版。通过知识蒸馏技术将DeepSeek-R1(参数量67B)的推理能力迁移至更小的模型中。可以简单理解为蒸馏版比原始版本更厉害。

DeepSeek-模型(model)介绍

目前这些模型可以在多个大模型框架中使用(包括我们讲过的ollama和vllm,甚至未讲过的sglang等)。

量化模型

虽然这些模型对原始模型进行了蒸馏,但对于GPU的要求仍然较高。对于ollama框架来说,模型仍然较大,因此ollama对这些模型进行了进一步量化。以1.5模型为例,默认格式是fp16,原始大小是3.6G,量化一次可以降低接近50%的大小,也相对降低对显存的需求。

DeepSeek-模型(model)介绍

显存需求

此图是我从互联网找来,仅供参考。

DeepSeek-模型(model)介绍

实测ollama运行deepseek-r1:32b-qwen-distill-q8_0模型,显存占用在40G左右。

DeepSeek-模型(model)介绍

vllm运行deepseek-ai/DeepSeek-R1-Distill-Qwen-14B和deepseek-ai/DeepSeek-R1-Distill-Qwen-32B模型,显存占用都是到116G(vllm会按照显存的90%去计算剩余显存,当模型等资源加载完成以后剩下的都会用作缓存)。

代码语言:javascript代码运行次数:0

运行复制```javascript(VllmWorkerProcess pid=195) INFO 03-09 10:10:40 worker.py:267] model weights take 15.41GiB; non_torch_memory takes 0.14GiB; PyTorch activation peak memory takes 0.24GiB; the rest of the memory reserved for KV Cache is 12.76GiB.```

DeepSeek-模型(model)介绍

来源:https://www.php.cn/faq/1287655.html
上一篇好用的游戏盒子推荐 哪些游戏盒子比较好用 下一篇剪映怎么旋转视频画面
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
126邮箱官方网站首页在线快速登录入口地址
手机教程 · 2026-06-04

126邮箱官方网站首页在线快速登录入口地址

126邮箱官网登录入口为http: www 126 com,提供单页快速登录界面,支持多端协同与扫码登录,具备安全验证强化、邮件管理及资源加载优化等一系列功能。

Artworkout双人画画免费下载入口地址
手机教程 · 2026-06-04

Artworkout双人画画免费下载入口地址

ArtWorkout的双人协同绘画功能,近期在安卓平台迎来了全新版本v0 1 83。安装包大小为172 8MB,界面为中文且无广告,可直接通过官方直链下载并安装使用。最关键的是——完全免费,无需注册,打开应用就能和朋友或陌生人在同一张画布上实时涂鸦。遗憾的是,iOS版本目前尚未上线双人合作模式,用户

dynamicSpot无障碍与悬浮窗权限开启步骤
手机教程 · 2026-06-04

dynamicSpot无障碍与悬浮窗权限开启步骤

DynamicSpot想要在安卓手机上还原出灵动岛那套效果,有三项权限必须提前搞定。这三项权限一个都不能少,否则通知抓不到、弹窗浮不起来、动画直接罢工——哪一环断了都白搭。简而言之,想让DynamicSpot正常运转,得先把无障碍服务、通知使用权和悬浮窗权限这三关过了。下面一步步来拆解。开启Dyna

dynamicSpot灵动岛功能设置方法
手机教程 · 2026-06-04

dynamicSpot灵动岛功能设置方法

想在安卓手机上体验iPhone灵动岛那种药丸状悬浮通知和音乐控制效果?目前最成熟的方案就是dynamicSpot。不过,有一说一,这个应用对权限的要求相当严格——权限没开全,就会一直黑屏或闪退,完全用不了。 先来梳理一下核心步骤:开启通知访问、悬浮窗和辅助功能三项权限,缺一不可;然后启动默认模式或手

南美水族论坛官方主页入口
手机教程 · 2026-06-04

南美水族论坛官方主页入口

南美水族论坛官方入口为bbs tropica cn,拥有超十六万水草帖、三十万条造景记录及稳定拍卖频道,内置鱼缸计算器等实用工具,支持多端适配与高效搜索,社区活跃度与内容专业性居国内前列。