AMD近日正式推出旗下首款面向AI开发者的迷你主机——锐龙AI Halo,定位为本地大模型部署的高性能计算平台。该产品面向需要频繁训练和推理大型语言模型的开发者,可直接在本地运行参数规模达2000亿的模型,减少对云服务的依赖。产品提供Windows 11专业版和Linux两个SKU,定价3999美元(约合2.7万元软妹币)。

硬件核心采用锐龙AI Max+ 395处理器,基于Zen 5架构,配备16核心32线程,集成40个RDNA 3.5计算单元的Radeon 8060S核显,以及算力达50 TOPS的XDNA 2 NPU。整机TDP为120W,搭配128GB LPDDR5X-8000统一内存和2TB PCIe Gen4×4 SSD。CPU、GPU与NPU共享同一内存池,无需跨芯片搬运数据,大幅提升本地推理效率。整机尺寸仅为149×149×43mm,重约1.2kg,便于放置在办公桌面。
性能对比:超越NVIDIA DGX Spark与Mac Mini M4 Pro
与竞品NVIDIA DGX Spark(定价4679美元)相比,锐龙AI Halo在多个大模型测试中表现更优。AMD官方数据显示,在GLM 4.7上速度快14%,在GPT-OSS 120B上快7%,在Qwen 3.5 122B上快12%。同时锐龙AI Halo支持Windows与Linux双系统,而DGX Spark仅支持Linux。与Apple Mac Mini M4 Pro相比,在Ace Step 1.5 XL等任务中性能可达3.3至7.3倍,且价格基本持平,并能运行参数大两倍的模型。
软件生态与开发支持
该机完整支持AMD ROCm 7.2.2套件,已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架完成优化。产品还预置了5份AI Playbooks,可帮助开发者快速上手。AMD承诺对GPT-OSS、FLUX.2等前沿模型提供零日支持,确保新模型发布后能第一时间在本地运行。
成本节省与未来升级
AMD估算,搭载锐龙AI Max+ 395的Halo平台每天约处理600万token,每月可为AI开发者节省约750美元云服务支出,数月即可收回整机成本。此外,升级版平台预计在2026年Q3推出,搭载锐龙AI Max+ PRO 495处理器,统一内存提升至192GB(最多160GB可分配为显存),NPU算力升至55 TOPS,届时将能本地运行3000亿参数的大模型。
