四台Mac Studio组AI集群:1.5TB内存,硬件成本近30万
12月25日消息,知名工程师Jeff Geerling近日完成了一项技术挑战,他借助macOS 26.2系统的最新特性,成功将四台搭载M3 Ultra芯片的Mac Studio整合为一体,打造出一个拥有1.5TB统一内存的AI计算集群。
此次集群成功的关键,在于macOS 26.2引入的一项核心功能——基于雷雳5接口的RDMA(远程直接内存访问)。通过雷雳5连接,一台Mac可以直接读取另一台设备的内存,无需CPU介入处理。

在Geekbench 6的多核性能测试中,该集群轻松超越了Dell Pro Max with GB10和Framework Desktop等对手。其双精度浮点运算性能更是突破了1 TFLOPS,而在闲置状态下的功耗则低于10瓦。

在AI推理方面,单机运行Llama 3.2 3B模型时,每秒可处理154.6个token;而在运行大型的Llama 3.1 70B模型时,每秒仍能维持14.1个token的处理速度。这两项测试的性能表现均远超其他竞品平台。


此外,在尝试运行DeepSeek R1 671B超大型模型时,其他系统均无法正常工作,而Mac Studio集群则凭借1.5TB的统一内存,成功完成了这一挑战。

RDMA over Thunderbolt 5在这个AI集群中发挥了关键作用。启用RDMA后,内存访问延迟从TCP协议的300微秒大幅降低至50微秒以下。


在使用exo系统测试Qwen3 235B模型时,四台设备每秒可处理31.9个token,比基于TCP的llama.cpp快了一倍以上;运行DeepSeek V3.1时,速度更是达到了每秒32.5个token。

尽管RDMA表现优异,但在高负载时偶尔会出现系统崩溃的情况。

另外值得注意的是,由Mac Studio组成的AI集群总硬件成本约为4万美元(约合人民币28万元)。相比其他两个对比平台,这一价格更为昂贵。
热门专题
热门推荐
摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成,并已由人工审核。 随着企业数字化转型进入智能体(Agent)驱动的新阶段,如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》(等保2 0)的严格框架下,企业级智能体的部署必须同时满足效率提升与合规保障的双
使用情景 对于外贸从业者来说,年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划,既要系统梳理过去一年的业绩成果与经验得失,也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天,一份逻辑严谨、数据详实、洞察深刻的总结报告,不仅是个人专业能力的集中体现,更是赢得管理层支
使用情景 又到年末了,年度安全工作总结是每个团队都绕不开的环节。这份总结的价值,远不止于一份简单的回顾。它更像是一份“体检报告”,清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好,哪里还有隐患,从而为来年的精准施策打下坚实的基础。 不过,说起写总结、做PPT,不少人就开始头疼了:内容怎么组织
Zcash (ZEC) 月度暴涨520%:深度解析后市行情与关键点位 近期,隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情,月度涨幅高达520%,价格一度逼近300美元,创下自2021年12月以来的新高。在加密市场整体承压的背景下,ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分
在存量竞争的时代,电商售后数据早已超越了“成本中心”的单一角色,它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而,现实往往骨感:多平台、多店铺、多套ERP系统并存,数据散落一地。靠人工手动汇总?不仅耗时费力,更关键的是,你永远无法实现真正的实时预警与敏捷响应。那么,电商售后数据





