0

0

DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储

看不見的法師

看不見的法師

发布时间:2025-07-02 14:04:12

|

854人浏览过

|

来源于php中文网

原创

deepseek 开源周的压轴日,推出了 fire-flyer file system(3fs),这是一个面向 ai 训练与推理任务的高效分布式文件系统。与此同时,deepseek 还发布了基于 3fs 的轻量级数据处理框架 smallpond,该框架结合了 duckdb 和 3fs 的优势。

DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储AI训练中的数据挑战在进行人工智能模型训练时,数据存储与访问效率往往成为影响整体性能的关键因素。例如:

数据访问延迟:在分布式训练场景中,由于数据通常存放在远程服务器上,频繁的 I/O 操作会导致显著延迟,从而拖慢整个训练过程;存储瓶颈:随着模型和数据集规模不断扩大,传统文件系统难以应对日益增长的高并发数据访问需求;数据一致性难题:在分布式环境下,确保数据一致性和可靠性是一项复杂任务。3FS 的核心特性与优势3FS 是一款高性能分布式文件系统,专为满足 AI 训练与推理工作负载的需求而打造。它充分利用现代 SSD 和 RDMA 网络技术,提供共享存储层,简化了分布式应用的开发流程。其主要特点包括:

性能与易用性分离架构:整合数千块 SSD 的吞吐能力与数百个存储节点的网络带宽,使应用程序可以更高效地访问存储资源;强一致性保障:采用 CRAQ(Chain Replication with Apportioned Queries)机制实现强一致性;通用文件接口:基于事务型键值存储(如 FoundationDB)构建无状态元数据服务,支持标准文件接口,无需额外学习新的存储 API;适应多种工作负载的能力数据准备:将数据分析管道的输出整理为分层目录结构,有效管理大规模中间数据;数据加载:支持跨计算节点的随机访问,无需预取或 Shuffle 数据集,提升训练效率;CheckPoint 支持:具备大规模训练任务的高吞吐并行 Checkpoint 机制;KVCache 推理优化:相比 DRAM 缓存,提供更具性价比的方案,具备更高吞吐能力和更大的缓存容量。3FS 性能表现3FS 在高性能存储方面表现出色,能够很好地应对 AI 训练与推理过程中的极端 I/O 需求。具体表现为:

峰值吞吐能力在大规模读压力测试中,3FS 展现出极高的吞吐能力。测试环境使用了 180 个存储节点(每个节点配备 2×200Gbps InfiniBand NICs 和 16 块 14TiB NVMe SSD),并通过 500 多个客户端节点发起并发读取请求(每个客户端配备 1×200Gbps InfiniBand NIC)。最终聚合读取吞吐量达到 6.6 TiB/s,在 AI 训练产生额外背景流量的情况下,仍能保持出色的 I/O 性能。

DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储GraySort 测试结果3FS 在 GraySort 基准测试中同样表现优异,该测试用于衡量大规模数据集排序能力。测试分为两个阶段:

一览AI绘图
一览AI绘图

一览AI绘图是一览科技推出的AIGC作图工具,用AI灵感助力,轻松创作高品质图片

下载

第一阶段:通过 key 的前缀位进行数据分区(Shuffle);第二阶段:在各个分区内执行排序。测试集群由 25 个存储节点(每个节点包含 2 个 NUMA 域,每个 NUMA 运行 1 个存储服务,2×400Gbps NICs)和 50 个计算节点(每个节点包含 2 个 NUMA 域、192 个物理核心、2.2 TiB RAM 和 1×200Gbps NIC)组成。在 8192 个分区上对 110.5 TiB 的数据进行排序,仅耗时 30 分钟 14 秒,平均吞吐量达到 3.66 TiB/分钟。

DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储KVCache 表现KVCache 是一种用于优化 LLM 推理的技术,通过缓存解码器层中先前 token 的键值向量来避免重复计算。下图展示了所有 KVCache 客户端的读取吞吐情况,其中峰值吞吐量高达 40 GiB/s。

DeepSeek 开源周第五弹:3FS —— 专为 AI 训练和推理设计的分布式存储参考资料deepseek-ai/3FS:https://www.php.cn/link/03f396a359ef22a21e37b7b45f4d9979

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

319

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

229

2023.10.07

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6049

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

783

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1052

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1097

2024.03.01

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

994

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

53

2025.10.17

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
从零开始到WEB响应式布局
从零开始到WEB响应式布局

共80课时 | 18.4万人学习

Git 教程
Git 教程

共21课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号