8月25日最新动态,人工智能领域迎来重要突破——深度求索正式推出DeepSeek-V3.1版本。值得一提的是,此次升级最具突破性的亮点是加入了UE8M0 FP8的全新支持。

在官方发布说明中,DeepSeek特别强调:UE8M0 FP8格式是专门为国产新一代芯片量身定制的关键技术。

东莞证券分析团队发表观点指出,这种新型数值格式通过提升灵活性,能够更好地支持复杂模型的推理运算。它具有双重优势:既显著提高芯片的解码效率与计算性能,又为国产芯片适配更大规模模型开辟了新方向。这将有力推动国产AI算力生态的快速构建。
关于UE8M0 FP8的技术原理与实际价值
人工智能专家、清华大学计算机系梁斌博士深入解读:DeepSeek此次重点推广的UE8M0 FP8与英伟达现有的FP8标准存在本质差异,形成了两套独立的技术体系。
他解释道:"面对显存容量有限而模型规模持续膨胀的现实矛盾,参数量化技术势在必行。FP32是用32位表示一个参数,FP8则压缩至8位。显然在精度可接受范围内,位数越少就能在显存中存储更多参数。"
目前主流的FP8实现方案主要有两种:英伟达采用的E4M3/E5M2方案,以及DeepSeek推广的UE8M0方案。核心区别在于--前者保留3-2位小数点位来提高精度,后者则完全舍弃小数点以换取更低功耗、更快运算速度和更低芯片要求。
梁博士进一步指出:"DeepSeek力挺UE8M0 FP8标准,加之国产芯片厂商积极跟进,意味着我们在技术上正与英伟达体系彻底分道扬镳。未来推理模型将面临选择:要么跟随DeepSeek这套体系,要么沿用英伟达标准。目前国内芯片企业都在全力拥抱DeepSeek标准。"
"华为等厂商为适配这一标准正在全力攻坚,成功的意义堪比里程碑。DeepSeek展现出的前瞻性和魄力,确实将国产大模型的发展推向了一个全新高度,这种突破令人振奋。"

