先说个有意思的发现:现在内存条的使用寿命远超服务器本身——服务器3到5年一换,内存却能跑7到10年。这中间的浪费,想想就心疼。Meta显然也注意到了这一点,于是在ISCA 2026大会上,他们拿出了Vistara方案,一句话概括就是:给新服务器装上拆下来的旧DDR4内存。
具体怎么做到的?核心在于Meta自研了一套基于CXL(Compute Express Link,计算快速链路)标准的ASIC芯片,姑且就叫它Vistara。旧服务器退役后,拆下来的DDR4 DIMM不会被扔进垃圾桶,而是装进依赖DDR5的新机器里。Vistara ASIC充当桥梁,通过PCIe Gen5 x16接口把这些旧内存桥接到新主机处理器上。这就像给新服务器安了个外设,共享一个由旧内存组成的内存池。

用Vistara的理由也很直白:市面上大多数CXL解决方案都捆绑了DRAM和控制器,不支持DDR4,而且功耗和成本都不低。而DDR4偏偏是重新利用旧内存的必需品,所以Meta干脆自己下场,从零定制。每颗Vistara ASIC芯片拥有两个独立的72-bit DDR4通道,速度最高可达3200 MT/s,如果配备64 GB DIMM条,单芯片就能做到256 GB容量。

硬件部署上,这套方案被装进一个叫MemServer的设备里。每台设备由一颗AMD Turin处理器驱动,拥有158个核心、316个线程。设备本身配备DDR5内存,再通过Vistara ASIC额外设载256 GB的DDR4内存。Vistara CXL卡被安在机箱后部的专用插槽里,机箱通过大容量风扇定向送风来散热。整个设计看起来非常工整。

更值得关注的是,这并非实验室里的概念验证。Meta表示,Vistara已经在超大规模基础设施中投产,覆盖了数百万台服务器。具体用在哪里?分离式机器学习推理、大数据处理、数据库、分布式缓存,以及CI/CD构建系统,样样都沾。
软硬协同是这套方案的另一个亮点。硬件侧自研了CXL ASIC,软件侧则基于Transparent Page Placement(透明页放置,TPP)来优化。简单说,就是系统根据工作负载的实际情况,自动决定哪些数据应该放在本地DDR5内存上,哪些可以放到扩展的DDR4内存池中。按需配比,避免性能浪费。

效果数字摆在面前:在某些分离式机器学习推理场景下,服务器数量可以减少最多25%;在分布式缓存场景中,平均延迟更是下降了29%。这些都是实打实的成本与性能收益。在当前全球内存供应趋紧的大背景下,这种“变废为宝”的思路,正在给超大规模数据中心带来新的参考价值。
参考论文地址:参考论文地址
