Split Learning：把AI模型拆开训练的隐私保护技术_AI热词解释_游乐网

Split Learning：把AI模型拆开训练的隐私保护技术

类型：机器学习技术2026-06-01

Split Learning（分割学习）是一种分布式机器学习框架，它将深度神经网络在参与方和服务器之间纵向切分：每个参与方只保留网络的前几层，服务器持有后几层。训练时各方在不直接暴露原始数据的前提下，通过交换中间层激活值与梯度来完成模型协同训练，既保护数据隐私，又分担计算压力。

本次查询：Split Learning

中文解释：分割学习

常见场景：适用于医疗 / 金融等跨机构数据协作场景 / 尤其是数据量庞大且隐私敏感的垂直领域。

一句话解释

Split Learning 简单说就是“把大脑切开分着用”——将完整深度神经网络从中间某个层切开，前段放在数据持有方本地运算，后段放在协作服务器上运算，两者只交换中间层的计算结果（激活值与梯度），原始数据始终不出本地。

为什么会被关注

随着数据隐私法规（如《个人信息保护法》）收紧，医疗、金融等行业跨机构合作建模时无法直接共享原始数据。Split Learning 提供了一种可行方案：不共享数据也能训练出准确模型，甚至在某些场景下比联邦学习通信效率更高。

同时，它能让计算能力有限的边缘设备将大部分计算“外包”给云服务器，只需保存轻量级本地网络，适合移动端、物联网等资源受限场景，因此被学术界和工业界同时看重。

核心逻辑

假设一个深度网络有10层，Split Learning 把前3层放在客户端（数据持有方），后7层放在服务器端。客户端利用本地数据计算前3层得到中间结果（称为“ smashed data ”），发送给服务器；服务器利用这些中间结果继续计算后7层，得到预测并计算损失，再把梯度的反向传播结果通过中间结果回传给客户端。

整个过程中，客户端看不到服务器端的网络结构，服务器也看不到客户端的原始输入，双方只交换抽象程度较高的中间特征。隐私保护程度取决于切分位置（切得越深，中间结果包含的原始信息越少，但通信量越大）。

常见场景

医院联盟：多家医院需要联合训练癌症诊断模型，但受限于患者隐私不能分享CT影像。每家在本地运行前几层网络，将特征图发给中央服务器共享学习，患者数据不出院方。

移动App与云协同：手机端运行轻量预提取层，将压缩后的中间表示上传云端，利用强大GPU完成复杂推理。用户照片在手机上已被初步处理，云端拿不到原始像素。

容易混淆的点

很多人把 Split Learning 等同于联邦学习（Federated Learning），但二者核心不同：联邦学习每方持有完整模型，只交换梯度或参数；Split Learning 则把模型本身拆开，交换的是中间层激活值。联邦学习的客户端计算负担更重，而 Split Learning 的通信量通常更大。

另一个易混概念是“模型分割推理”，那只是推理阶段将模型拆到不同设备加速；Split Learning 的独特之处在于训练阶段也采用这种分割协作，且每轮只训练一个客户端（或支持并行变体），隐私保护性质与联邦学习互补。

来源：AI 热词解释频道整理

Split Learning 联邦学习隐私计算分布式机器学习模型分割

上一篇联邦学习 下一篇Self-Supervised Learning 自监督学习：让AI自己给自己出题

AI 热词解释