首页 游戏 软件 资讯 排行榜 专题
首页
手机教程
DeepSeek爆了,普通人如何3小时完全从0训练自己的大模型

DeepSeek爆了,普通人如何3小时完全从0训练自己的大模型

热心网友
86
转载
2025-04-23

deepseek爆了,普通人如何3小时完全从0训练自己的大模型

今天为大家介绍一个非常实用的开源项目 - MiniMind。它使得我们能够使用普通电脑,在短短3小时内训练出一个迷你版的ChatGPT!

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这个项目为何如此特别?目前市场上的大型语言模型通常具有数十亿参数,训练成本高昂。即便是想要学习和研究的人,也常常被高昂的硬件门槛所阻隔。而MiniMind通过巧妙的设计,将模型参数压缩到了最低,使得个人开发者也能亲手训练AI模型!

最小版本仅有26M大小(约为GPT-3的1/7000),普通的游戏显卡即可运行。项目提供了完整的训练流程:

基础语言能力训练(预训练)对话能力训练(指令微调)快速适应新任务(LoRA微调)优化回答质量(DPO偏好对齐)环境需要代码语言:javascript代码运行次数:0运行复制```javascriptCPU: Intel(R) Core(TM) i9-10980XE CPU @ 3.00GHz内存:128 GB显卡:NVIDIA GeForce RTX 3090(24GB) * 2环境:python 3.9 + Torch 2.1.2 + DDP单机多卡训练

Ubuntu == 20.04Python == 3.9Pytorch == 2.1.2CUDA == 12.2requirements.txt(本项目环境依赖)实际应用场景1. 个性化助手开发你可以训练一个针对特定领域的AI助手,比如:

客服机器人:根据公司产品知识库训练教育辅导:针对特定学科的习题讲解行业助手:为特定行业提供专业建议2. 技术学习与研究了解大语言模型的工作原理实践各种训练方法尝试模型优化和改进3. 产品原型验证快速验证AI产品创意测试不同场景下的效果收集用户反馈进行迭代技术亮点解析轻量级架构采用Transformer的Decoder-Only结构使用RMSNorm预标准化提升性能引入旋转位置编码处理长文本创新的专家模型版本(MoE)提供4×26M的混合专家模型通过专家分工提升模型能力保持较低的计算资源需求灵活的部署选项支持单卡/多卡训练兼容主流深度学习框架提供网页交互界面上手有多简单?只需几步就能开始:

代码语言:javascript代码运行次数:0https://www.w3.org/2000/svg"> d="M6.66666 10.9999L10.6667 7.99992L6.66666 4.99992V10.9999ZM7.99999 1.33325C4.31999 1.33325 1.33333 4.31992 1.33333 7.99992C1.33333 11.6799 4.31999 14.6666 7.99999 14.6666C11.68 14.6666 14.6667 11.6799 14.6667 7.99992C14.6667 4.31992 11.68 1.33325 7.99999 1.33325ZM7.99999 13.3333C5.05999 13.3333 2.66666 10.9399 2.66666 7.99992C2.66666 5.05992 5.05999 2.66659 7.99999 2.66659C10.94 2.66659 13.3333 5.05992 13.3333 7.99992C13.3333 10.9399 10.94 13.3333 7.99999 13.3333Z" fill="currentcolor">运行https://www.w3.org/2000/svg"> clip-rule="evenodd" d="M4.5 15.5V3.5H14.5V15.5H4.5ZM12.5 5.5H6.5V13.5H12.5V5.5ZM9.5 2.5H3.5V12.5H1.5V0.5H11.5V2.5H9.5Z" fill="currentcolor" fill-rule="evenodd">复制```javascript

1. 克隆项目git clone https://www.php.cn/link/c7e2ac420af977df8c6ccc95ac8dc911# 2. 安装依赖pip install -r requirements.txt# 3. 开始对话测试python 2-eval.py

登录后复制

如果想要可视化界面,还可以使用内置的网页版:

代码语言:javascript代码运行次数:0运行复制```javascript

streamlit run fast_inference.py

定制大模型1. 克隆项目代码代码语言:javascript代码运行次数:0https://www.w3.org/2000/svg"> d="M6.66666 10.9999L10.6667 7.99992L6.66666 4.99992V10.9999ZM7.99999 1.33325C4.31999 1.33325 1.33333 4.31992 1.33333 7.99992C1.33333 11.6799 4.31999 14.6666 7.99999 14.6666C11.68 14.6666 14.6667 11.6799 14.6667 7.99992C14.6667 4.31992 11.68 1.33325 7.99999 1.33325ZM7.99999 13.3333C5.05999 13.3333 2.66666 10.9399 2.66666 7.99992C2.66666 5.05992 5.05999 2.66659 7.99999 2.66659C10.94 2.66659 13.3333 5.05992 13.3333 7.99992C13.3333 10.9399 10.94 13.3333 7.99999 13.3333Z" fill="currentcolor">运行https://www.w3.org/2000/svg"> clip-rule="evenodd" d="M4.5 15.5V3.5H14.5V15.5H4.5ZM12.5 5.5H6.5V13.5H12.5V5.5ZM9.5 2.5H3.5V12.5H1.5V0.5H11.5V2.5H9.5Z" fill="currentcolor" fill-rule="evenodd">复制javascript git clone https://www.php.cn/link/c7e2ac420af977df8c6ccc95ac8dc911cd minimind
登录后复制环境安装代码语言:javascript代码运行次数:0运行复制javascriptpip install -r requirements.txt -i https://www.php.cn/link/a6455ffc4e47fd737db213366771ec0e# 测试torch是否可用cudaimport torchprint(torch.cuda.is_available())
登录后复制

如果不可用,请自行去torch_stable下载whl文件安装。参考链接,

自己训练数据集下载数据集放到./dataset目录下python data_process.py命令处理数据集,例如pretrain数据提前进行token-encoder、sft数据集抽离qa到csv文件在./model/LMConfig.py中调整model的参数配置这里仅需调整dim和n_layers和usemoe参数,分别是(512+8)或(768+16),对应于minimind-v1-small和minimind-v1`python 1-pretrain.py执行预训练,得到pretrain.pth作为预训练的输出权重python 3-full_sft.py执行指令微调,得到fullsft.pth作为指令微调的输出权重python 4-lora_sft.py执行lora微调(非必须)python 5-dpo_train.py`执行DPO人类偏好强化学习对齐(非必须)持续进化中项目正在快速发展,目前已支持:

文本对话:流畅的中英文交互视觉理解:可以理解和描述图像知识更新:持续优化训练数据性能提升:不断改进模型结构最后MiniMind降低了AI开发的门槛,让更多人能够参与到大语言模型的探索中来。无论你是:

想入门AI的开发者需要定制化AI助手的企业对语言模型感兴趣的研究者这个项目都能帮你快速起步,并在实践中不断成长。项目完全开源,想要了解更多MiniMind项目信息的读者可以查看项目地址:

https://www.php.cn/link/ac65fa3ab83a6deeaa332196ad0ebabb

来源:https://www.php.cn/faq/1286219.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Pywinrm,一个 Python 管理利器!
科技数码
Pywinrm,一个 Python 管理利器!

Pywinrm 通过Windows远程管理(WinRM)协议,让Python能够像操作本地一样执行远程Windows命令,真正打通了跨平台管理的最后一公里。 在混合IT环境中,Linux机器管理Wi

热心网友
04.07
全网炸了!5亿人用的Axios竟被投毒,你的密钥还保得住吗?
科技数码
全网炸了!5亿人用的Axios竟被投毒,你的密钥还保得住吗?

早些时候,聊过 Python 领域那场惊心动魄的供应链攻击。当时我就感叹,虽然我们 JavaScript 开发者对这类套路烂熟于心,但亲眼目睹这种规模的“投毒”还是头一次。 早些时候,聊过 Pyth

热心网友
04.07
Toga,一个超精简的 Python 项目!
科技数码
Toga,一个超精简的 Python 项目!

Toga 是 BeeWare 家族的核心成员,号称“写一次,跑遍所有平台”,而且用的是系统原生控件,不是那种一看就是网页套壳的界面 。 写了这么多年 Python,你是不是也想过:要是能一套代码跑

热心网友
04.07
Python 异常处理:别再用裸奔的 try 了
科技数码
Python 异常处理:别再用裸奔的 try 了

异常处理的核心:让错误在正确的地方被有效处理。正确的地方,就是别在底层就把异常吞了,也别在顶层还抛裸奔的 Exception。 异常处理写得好,半夜不用起来改 bug。1 你是不是也这么干过?tr

热心网友
04.07
OpenClaw如何自定义SKILL
AI
OpenClaw如何自定义SKILL

1 Skills机制概述 提起OpenClaw的Skills机制,不少人可能会把它想象成传统意义上的可执行插件。其实,它的内涵要更精妙一些。 简单说,Skills本质上是一套基于提示驱动的能力扩展机制。它并不是一个可以独立“跑”起来的程序模块,而是通过一份结构化描述文件(核心就是那个SKILL m

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08