DeepSeek发布UE8M0 FP8标准，专为国产芯片设计，全面替代NVIDIA方案

8月25日消息，近日，深度求索宣布正式发布DeepSeek-V3 1。其中一个重大的进步和惊喜，就是支持了UE8M0 FP8。DeepSeek在其官宣发布DeepSeek-V3 1的文章中提到，UE

8月25日最新动态，人工智能领域迎来重要突破——深度求索正式推出DeepSeek-V3.1版本。值得一提的是，此次升级最具突破性的亮点是加入了UE8M0 FP8的全新支持。

在官方发布说明中，DeepSeek特别强调：UE8M0 FP8格式是专门为国产新一代芯片量身定制的关键技术。

东莞证券分析团队发表观点指出，这种新型数值格式通过提升灵活性，能够更好地支持复杂模型的推理运算。它具有双重优势：既显著提高芯片的解码效率与计算性能，又为国产芯片适配更大规模模型开辟了新方向。这将有力推动国产AI算力生态的快速构建。

关于UE8M0 FP8的技术原理与实际价值

人工智能专家、清华大学计算机系梁斌博士深入解读：DeepSeek此次重点推广的UE8M0 FP8与英伟达现有的FP8标准存在本质差异，形成了两套独立的技术体系。

他解释道："面对显存容量有限而模型规模持续膨胀的现实矛盾，参数量化技术势在必行。FP32是用32位表示一个参数，FP8则压缩至8位。显然在精度可接受范围内，位数越少就能在显存中存储更多参数。"

目前主流的FP8实现方案主要有两种：英伟达采用的E4M3/E5M2方案，以及DeepSeek推广的UE8M0方案。核心区别在于--前者保留3-2位小数点位来提高精度，后者则完全舍弃小数点以换取更低功耗、更快运算速度和更低芯片要求。

梁博士进一步指出："DeepSeek力挺UE8M0 FP8标准，加之国产芯片厂商积极跟进，意味着我们在技术上正与英伟达体系彻底分道扬镳。未来推理模型将面临选择：要么跟随DeepSeek这套体系，要么沿用英伟达标准。目前国内芯片企业都在全力拥抱DeepSeek标准。"

"华为等厂商为适配这一标准正在全力攻坚，成功的意义堪比里程碑。DeepSeek展现出的前瞻性和魄力，确实将国产大模型的发展推向了一个全新高度，这种突破令人振奋。"