锐龙AI Halo迷你主机上市 2.7万元本地运行2000亿参数模型_AI热点日报

锐龙AI Halo迷你主机上市 2.7万元本地运行2000亿参数模型

类型：热点整理2026-07-04

AMD首款AI开发者迷你主机锐龙AIHalo上市，定价3999美元（约2 7万元人民币），搭载锐龙AIMax+395处理器，配备128GB统一内存和2TBSSD，可在本地运行最高2000亿参数大模型。性能超越NVIDIADGXSpark，支持Windows与Linux双系统，并提供完整R

AMD近日正式推出旗下首款面向AI开发者的迷你主机——锐龙AI Halo，定位为本地大模型部署的高性能计算平台。该产品面向需要频繁训练和推理大型语言模型的开发者，可直接在本地运行参数规模达2000亿的模型，减少对云服务的依赖。产品提供Windows 11专业版和Linux两个SKU，定价3999美元（约合2.7万元软妹币）。

锐龙AI Halo开发者迷你主机上市定价2.7万元可本地运行2000亿参数大模型

硬件核心采用锐龙AI Max+ 395处理器，基于Zen 5架构，配备16核心32线程，集成40个RDNA 3.5计算单元的Radeon 8060S核显，以及算力达50 TOPS的XDNA 2 NPU。整机TDP为120W，搭配128GB LPDDR5X-8000统一内存和2TB PCIe Gen4×4 SSD。CPU、GPU与NPU共享同一内存池，无需跨芯片搬运数据，大幅提升本地推理效率。整机尺寸仅为149×149×43mm，重约1.2kg，便于放置在办公桌面。

性能对比：超越NVIDIA DGX Spark与Mac Mini M4 Pro

与竞品NVIDIA DGX Spark（定价4679美元）相比，锐龙AI Halo在多个大模型测试中表现更优。AMD官方数据显示，在GLM 4.7上速度快14%，在GPT-OSS 120B上快7%，在Qwen 3.5 122B上快12%。同时锐龙AI Halo支持Windows与Linux双系统，而DGX Spark仅支持Linux。与Apple Mac Mini M4 Pro相比，在Ace Step 1.5 XL等任务中性能可达3.3至7.3倍，且价格基本持平，并能运行参数大两倍的模型。

软件生态与开发支持

该机完整支持AMD ROCm 7.2.2套件，已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架完成优化。产品还预置了5份AI Playbooks，可帮助开发者快速上手。AMD承诺对GPT-OSS、FLUX.2等前沿模型提供零日支持，确保新模型发布后能第一时间在本地运行。

成本节省与未来升级

AMD估算，搭载锐龙AI Max+ 395的Halo平台每天约处理600万token，每月可为AI开发者节省约750美元云服务支出，数月即可收回整机成本。此外，升级版平台预计在2026年Q3推出，搭载锐龙AI Max+ PRO 495处理器，统一内存提升至192GB（最多160GB可分配为显存），NPU算力升至55 TOPS，届时将能本地运行3000亿参数的大模型。

来源：驱动之家

延伸阅读

补充最近整理过的热点入口。