6月16日传来一则引人关注的消息:苹果M4等芯片内置的神经网络引擎,此前仅对推理任务开放——也就是说,开发者可以运行预训练好的AI模型,但若想直接用它训练新模型,却毫无可能。不过,X平台上一位名为@0x0SojalSec的用户自称成功绕过了M4的软件限制,并对M4 SoC完成了逆向工程分析。

整个操作将数据全部置于RAM中运行,因此执行速度极快,体验也相当流畅。这位开发者今天凌晨在X上发布了一个GitHub代码库,展示了如何充分释放M4的全部潜力。关键点在于:苹果并未开放直接与这些芯片通信的权限,因此他没有使用Core ML、Metal等苹果官方工具,也未调用GPU,而是从零开始构建了一套自定义MIL(模型中间语言),借助这套工具与M4进行交互。
由于M4的硬件能力被“锁定”,整个过程不得不采用一些巧妙方法。例如,当训练进程卡住、需要重置后才能继续时,自定义MIL会调用exec ()命令,使进程重新启动并继续训练。这样一来,程序可以刷新当前状态,避免直接崩溃,同时维持学习进程。
为了提升速度,整个解锁过程完全绕开了NAND闪存——闪存写入太慢,而RAM速度快得多,因此全程都能保持高速运行。突破软件限制后,iPad或Mac中的M4能展现出15.8TFLOPS的AI处理性能,足以应对AI模型训练任务。
最后需要说明:目前尚无法确认这套自定义MIL能否适用于更新的Apple Silicon芯片,也不确定exec ()在新平台上是否能按预期工作。毕竟,逆向工程这类操作,每一步都如同在钢丝上行走。
