四台Mac Studio组AI集群:1.5TB内存,硬件成本近30万
12月25日消息,知名工程师Jeff Geerling近日完成了一项技术挑战,他借助macOS 26.2系统的最新特性,成功将四台搭载M3 Ultra芯片的Mac Studio整合为一体,打造出一个拥有1.5TB统一内存的AI计算集群。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
此次集群成功的关键,在于macOS 26.2引入的一项核心功能——基于雷雳5接口的RDMA(远程直接内存访问)。通过雷雳5连接,一台Mac可以直接读取另一台设备的内存,无需CPU介入处理。

在Geekbench 6的多核性能测试中,该集群轻松超越了Dell Pro Max with GB10和Framework Desktop等对手。其双精度浮点运算性能更是突破了1 TFLOPS,而在闲置状态下的功耗则低于10瓦。

在AI推理方面,单机运行Llama 3.2 3B模型时,每秒可处理154.6个token;而在运行大型的Llama 3.1 70B模型时,每秒仍能维持14.1个token的处理速度。这两项测试的性能表现均远超其他竞品平台。


此外,在尝试运行DeepSeek R1 671B超大型模型时,其他系统均无法正常工作,而Mac Studio集群则凭借1.5TB的统一内存,成功完成了这一挑战。

RDMA over Thunderbolt 5在这个AI集群中发挥了关键作用。启用RDMA后,内存访问延迟从TCP协议的300微秒大幅降低至50微秒以下。


在使用exo系统测试Qwen3 235B模型时,四台设备每秒可处理31.9个token,比基于TCP的llama.cpp快了一倍以上;运行DeepSeek V3.1时,速度更是达到了每秒32.5个token。

尽管RDMA表现优异,但在高负载时偶尔会出现系统崩溃的情况。

另外值得注意的是,由Mac Studio组成的AI集群总硬件成本约为4万美元(约合人民币28万元)。相比其他两个对比平台,这一价格更为昂贵。
热门专题
热门推荐
微软战略转向:Win11内置应用将全面重构,告别网页套壳以提升性能 你是否感觉Windows 11某些应用响应迟缓,或是内存占用异常偏高?最新消息或许值得关注。据官方透露,微软正调整其应用开发战略,将逐步减少对网页技术的依赖,转而启动大规模原生应用重构计划。这一重大决策,标志着此前推广的“网页化”开
《红色沙漠》全支线任务图文攻略与深度解析 在开放世界大作《红色沙漠》中,丰富多样的支线任务是游戏体验不可或缺的一环。许多玩家初次接触时,可能会对任务系统感到困惑。实际上,每个支线都有其独特的设计思路与完成技巧。例如任务“图尔纳里的请求”,其核心玩法侧重于资源收集与体力劳动,你需要按照指示完成特定的伐
知名破解组织宣布成功突破《EA Sports FC 26》四重防护系统 近日,游戏安全领域传来重磅消息:因屡次攻破高级加密而声名鹊起的破译团队DenuvOwO,正式对外宣告已成功放出针对《EA Sports FC 26》的最新破解方案。该方案直接破解了游戏核心的Denuvo虚拟机加密技术,一石激起千
快速部署指南:基于DeepSeek与飞书的Ubuntu虚拟机镜像,30分钟完成私有AI助手搭建 你是否希望在本地快速搭建一个集成DeepSeek大模型能力、并能通过飞书机器人便捷调用的AI开发环境?我们提供的基于WSL2的Ubuntu预配置虚拟机镜像,正是为你量身打造的“一站式AI应用解决方案”。本
《绝地求生》全新“物品狩猎”躲猫猫模式正式上线:玩法宣传片深度解析 《绝地求生》重磅更新,备受期待的趣味玩法“物品狩猎”模式现已正式推出。这一全新的躲猫猫玩法究竟有何独特之处?官方已发布完整版宣传视频,为玩家们详细揭秘核心规则与对战策略。想要抢先了解新模式的玩家,可以通过本文的介绍一探究竟。 最新发





