DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储
在 deepseek 开源周的压轴日,推出了 fire-flyer file system(3fs),这是一个面向 ai 训练与推理任务的高效分布式文件系统。与此同时,deepseek 还发布了基于 3fs 的轻量级数据处理框架 smallpond,该框架结合了 duckdb 和 3fs 的优势。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
AI训练中的数据挑战在进行人工智能模型训练时,数据存储与访问效率往往成为影响整体性能的关键因素。例如:
数据访问延迟:在分布式训练场景中,由于数据通常存放在远程服务器上,频繁的 I/O 操作会导致显著延迟,从而拖慢整个训练过程;存储瓶颈:随着模型和数据集规模不断扩大,传统文件系统难以应对日益增长的高并发数据访问需求;数据一致性难题:在分布式环境下,确保数据一致性和可靠性是一项复杂任务。3FS 的核心特性与优势3FS 是一款高性能分布式文件系统,专为满足 AI 训练与推理工作负载的需求而打造。它充分利用现代 SSD 和 RDMA 网络技术,提供共享存储层,简化了分布式应用的开发流程。其主要特点包括:
性能与易用性分离架构:整合数千块 SSD 的吞吐能力与数百个存储节点的网络带宽,使应用程序可以更高效地访问存储资源;强一致性保障:采用 CRAQ(Chain Replication with Apportioned Queries)机制实现强一致性;通用文件接口:基于事务型键值存储(如 FoundationDB)构建无状态元数据服务,支持标准文件接口,无需额外学习新的存储 API;适应多种工作负载的能力数据准备:将数据分析管道的输出整理为分层目录结构,有效管理大规模中间数据;数据加载:支持跨计算节点的随机访问,无需预取或 Shuffle 数据集,提升训练效率;CheckPoint 支持:具备大规模训练任务的高吞吐并行 Checkpoint 机制;KVCache 推理优化:相比 DRAM 缓存,提供更具性价比的方案,具备更高吞吐能力和更大的缓存容量。3FS 性能表现3FS 在高性能存储方面表现出色,能够很好地应对 AI 训练与推理过程中的极端 I/O 需求。具体表现为:
峰值吞吐能力在大规模读压力测试中,3FS 展现出极高的吞吐能力。测试环境使用了 180 个存储节点(每个节点配备 2×200Gbps InfiniBand NICs 和 16 块 14TiB NVMe SSD),并通过 500 多个客户端节点发起并发读取请求(每个客户端配备 1×200Gbps InfiniBand NIC)。最终聚合读取吞吐量达到 6.6 TiB/s,在 AI 训练产生额外背景流量的情况下,仍能保持出色的 I/O 性能。
GraySort 测试结果3FS 在 GraySort 基准测试中同样表现优异,该测试用于衡量大规模数据集排序能力。测试分为两个阶段:
第一阶段:通过 key 的前缀位进行数据分区(Shuffle);第二阶段:在各个分区内执行排序。测试集群由 25 个存储节点(每个节点包含 2 个 NUMA 域,每个 NUMA 运行 1 个存储服务,2×400Gbps NICs)和 50 个计算节点(每个节点包含 2 个 NUMA 域、192 个物理核心、2.2 TiB RAM 和 1×200Gbps NIC)组成。在 8192 个分区上对 110.5 TiB 的数据进行排序,仅耗时 30 分钟 14 秒,平均吞吐量达到 3.66 TiB/分钟。

KVCache 表现KVCache 是一种用于优化 LLM 推理的技术,通过缓存解码器层中先前 token 的键值向量来避免重复计算。下图展示了所有 KVCache 客户端的读取吞吐情况,其中峰值吞吐量高达 40 GiB/s。
参考资料deepseek-ai/3FS:https://www.php.cn/link/03f396a359ef22a21e37b7b45f4d9979
相关攻略
FDUSD脱锚惊魂夜:币安生态稳定币的信任危机与系统性风险 2025年4月2日夜间,加密货币市场经历了一场突如其来的“压力测试”。由香港First Digital Trust Limited发行的美元稳定币FDUSD,在市场上演了惊心动魄的脱锚跳水,其兑USDT价格一度暴跌至0 8726美元。这场震
最近又折腾了下 Obsidian 的 Git 插件,虽然也有点麻烦,但它是适合我的。下面介绍下怎么配置和使用。 第一次使用 Obsidian 是在 2024 年,这是翻阅之前的文章 《Obsidia
这项由华为技术有限公司、南洋理工大学、香港大学和香港中文大学联合完成的突破性研究发表于2026年1月,论文编号为arXiv:2601 01426v1。研究团队通过一种名为SWE-Lego的创新训练方
12 月 27 日消息,科技媒体 NeoWin 今天(12 月 27 日)发布博文,报道称 AI 代码编辑器 Windsurf 本周发布 Wave 13 版,通过大幅升级多智能体工作流、性能可访问
NEO(小蚁区块链)旨在构建智能经济网络。NEO通过资产数字化和智能合约实现自动化管理,用户需在支持NEO交易的平台注册账户并获取数字货币,选择合适的交易对后,即可下单交易并确认。交易完成后,可在账户中查看NEO资产,或转移至个人数字储存中安全保管NEO。
热门专题
热门推荐
《灰烬之国》详细评测:目前仅支持单人,深度构筑与流派搭配是核心玩法 近日正式上线的动作Roguelike《灰烬之国》,以其高速流畅的俯视角战斗和极具深度的Build构筑系统,迅速吸引了大量核心玩家的关注。然而,许多玩家在入手前最关心的问题是:这款游戏是否支持多人联机合作? 答案是明确的:目前不支持。
在《魔兽世界》中如何高效公平地分配装备?团队管理者必看指南 对于任何一支《魔兽世界》的团队来说,顺利推倒副本首领固然值得庆祝,但这仅仅完成了目标的一半。真正考验团队凝聚力与管理者智慧的,往往是BOSS倒下之后的关键环节——装备的分配。这件事如果处理得当,能极大提振团队士气,让团队无往不利;反之,处理
《洛克王国世界》家园经验对照表:不同植物的经验获取效率分析 在《洛克王国世界》的家园系统中,种植植物是获取经验值的一个稳定且重要的途径。然而,不同种类植物的经验产出效率、生长周期存在显著差异。为了帮助玩家优化家园种植策略,我们结合玩家实测数据整理了一份详细的经验对照表,助您精准选择高性价比植物,最大
《洛克王国世界》自爆流玩法深度解析:刷钱效率与实战策略 在《洛克王国世界》多样化的战术体系中,自爆流凭借其高强度的刷钱效率与独特的对战风格,成为一种备受关注的玩法。许多玩家都对它的具体操作与实战技巧充满好奇。本文将结合核心实战经验,为你系统剖析自爆流的操作思路、阵容配置要点及关键注意事项,助你快速上
速览 本文为您带来《红色沙漠》中关键装备——嘟嘟鸟强化铁锅制作图纸的详细获取指南。获取流程的核心在于完成势力任务“智慧女巫”,并彻底净化“免罪圣所”。您需要清理区域内的所有敌人、击败最终守关BOSS,并成功解开一个关于核心的机关谜题,图纸即可入手。以下是分步详解。 红色沙漠嘟嘟鸟强化铁锅制作图纸完整





