2026年苹果全球开发者大会期间,LM Studio 与苹果进行了一项极具看点的合作——他们在本地利用四台 Mac Studio 构建的计算集群中,成功部署并运行了月之暗面自主研发的万亿参数大语言模型 Kimi K2.6。需要特别指出的是,这并非云端远程调用,而是实实在在在你的桌面设备上完成推理运行。

该模型整体参数量高达一万亿,采用混合专家(MoE)架构,每次推理时实际激活参数约为三百二十亿。同时,它支持超长上下文理解、多模态信息融合以及复杂智能体任务的执行——将其部署在本地运行,足以想象其对硬件配置的要求有多么苛刻。
四台 Mac Studio 借助苹果自研的内存共享与高速互联机制,协同工作后形成统一内存空间,总容量接近 1.5TB,恰好满足这个模型对内存带宽和容量的严苛需求。现场还展示了 LM Link 功能——用户通过 MacBook Neo 或 iPhone,即可在数据完全不离开本地的前提下,远程连接并调用集群中的模型。所有计算与通信均在设备端完成,无需依赖云端传输,这对注重数据隐私和敏感信息的场景而言意义重大。
测试数据同样具有说服力:在相同硬件配置下,Kimi K2.6 在优化模式下可稳定输出约每秒 28 个词元,推理效率表现突出,且整机功耗远低于传统 GPU 服务器集群。此次联合实践直接验证了消费级专业工作站承载前沿大模型推理的可行性,同时也展现了苹果软硬件协同体系在本地化部署方向上的实质性突破。LM Link 的远程访问能力已于 2026 年 6 月初完成版本升级,并正式支持端到端加密通信——行业中应有的安全底线,一项都没有缺席。
