
2026年2月12日,为了符合特定的出口管理规定,面向中国市场发售的高端工作站级显卡在规格方面作出了相应调整。其中,RTX 6000D便是基于RTX PRO 6000 Blackwell架构,经过功能精简后推出的特供型号。
根据行业内的反馈,这款显卡自发布以来,实际市场需求相对有限,尚未形成稳定的采购意向,市场接受度也并不明朗。
近期,一位技术领域的内容创作者拿到了一块RTX 6000D显卡,并对其进行了详尽的拆解与散热改造,包括加装定制水冷系统,完整呈现了其内部结构与工程设计。
外观方面,RTX 6000D延续了RTX PRO 6000 Server版本的无风扇设计方案,依靠整机系统风道完成散热。实测整卡峰值功耗略超400瓦。
接口配置上,板顶设有用于多卡协同的四枚3D立体同步接口及帧锁定/同步接口;供电则通过尾部16针专用接口实现。
芯片制程与核心平台保持一致,采用台积电4N工艺,搭载GB202图形处理器。但在计算资源上有所缩减:CUDA核心数量从24064个减少至19968个,Tensor核心从752个降至624个,光追核心由188个减为156个,三项指标均下调约17%;核心加速频率也从2617MHz下调至2430MHz,降幅约为7%。
显存配置同样调整:原512位宽、96GB容量的GDDR7显存,改为448位宽、84GB容量,对应带宽从1.79TB/s降至1.57TB/s,降幅接近13%。
综合上述调整,RTX 6000D在通用计算性能上相较原版下降约23%。以FP32精度为例,实测算力约为97.04TFlops,略低于RTX PRO 6000 Max-Q版本,但仍明显高于RTX PRO 5000 48GB型号。
在具体AI应用测试中,使用LMStudio运行DeepSeek R1 70B大语言模型,设定上下文长度为8000时,RTX 6000D单卡推理耗时13秒,生成速度为每秒24.79 Tokens,较RTX PRO 5000提升逾10%。
多卡部署方面,四卡配置可提供总计336GB显存,八卡扩展后达672GB,足以支持经过量化处理的671B参数规模模型运行。
拆解可见,其PCB布局与RTX PRO 6000完全一致,差异仅体现在显存颗粒数量上:由原本32颗三星3GB GDDR7颗粒缩减为28颗,正反面各布置14颗。
需特别说明的是,卡体左侧虽配备了四个DisplayPort接口,但不具备视频输出能力,在Windows系统下默认以纯计算模式加载TCC驱动;板顶除前述同步接口外,亦保留帧锁定功能支持;供电仍通过尾部16针接口完成。
