游乐游手机版

AI 热词解释

首页/AI热词解释/热词详情

Split Learning:把AI模型拆开训练的隐私保护技术

类型:机器学习技术2026-06-01
Split Learning(分割学习)是一种分布式机器学习框架,它将深度神经网络在参与方和服务器之间纵向切分:每个参与方只保留网络的前几层,服务器持有后几层。训练时各方在不直接暴露原始数据的前提下,通过交换中间层激活值与梯度来完成模型协同训练,既保护数据隐私,又分担计算压力。

本次查询:Split Learning

中文解释:分割学习

常见场景:适用于医疗 / 金融等跨机构数据协作场景 / 尤其是数据量庞大且隐私敏感的垂直领域。

一句话解释

Split Learning 简单说就是“把大脑切开分着用”——将完整深度神经网络从中间某个层切开,前段放在数据持有方本地运算,后段放在协作服务器上运算,两者只交换中间层的计算结果(激活值与梯度),原始数据始终不出本地。

为什么会被关注

随着数据隐私法规(如《个人信息保护法》)收紧,医疗、金融等行业跨机构合作建模时无法直接共享原始数据。Split Learning 提供了一种可行方案:不共享数据也能训练出准确模型,甚至在某些场景下比联邦学习通信效率更高。

同时,它能让计算能力有限的边缘设备将大部分计算“外包”给云服务器,只需保存轻量级本地网络,适合移动端、物联网等资源受限场景,因此被学术界和工业界同时看重。

核心逻辑

假设一个深度网络有10层,Split Learning 把前3层放在客户端(数据持有方),后7层放在服务器端。客户端利用本地数据计算前3层得到中间结果(称为“ smashed data ”),发送给服务器;服务器利用这些中间结果继续计算后7层,得到预测并计算损失,再把梯度的反向传播结果通过中间结果回传给客户端。

整个过程中,客户端看不到服务器端的网络结构,服务器也看不到客户端的原始输入,双方只交换抽象程度较高的中间特征。隐私保护程度取决于切分位置(切得越深,中间结果包含的原始信息越少,但通信量越大)。

常见场景

医院联盟:多家医院需要联合训练癌症诊断模型,但受限于患者隐私不能分享CT影像。每家在本地运行前几层网络,将特征图发给中央服务器共享学习,患者数据不出院方。

移动App与云协同:手机端运行轻量预提取层,将压缩后的中间表示上传云端,利用强大GPU完成复杂推理。用户照片在手机上已被初步处理,云端拿不到原始像素。

容易混淆的点

很多人把 Split Learning 等同于联邦学习(Federated Learning),但二者核心不同:联邦学习每方持有完整模型,只交换梯度或参数;Split Learning 则把模型本身拆开,交换的是中间层激活值。联邦学习的客户端计算负担更重,而 Split Learning 的通信量通常更大。

另一个易混概念是“模型分割推理”,那只是推理阶段将模型拆到不同设备加速;Split Learning 的独特之处在于训练阶段也采用这种分割协作,且每轮只训练一个客户端(或支持并行变体),隐私保护性质与联邦学习互补。

来源:AI 热词解释频道整理
上一篇联邦学习 下一篇Self-Supervised Learning 自监督学习:让AI自己给自己出题

相关热词

继续查看关联概念解释。

最新热词

最近新增和整理过的热词内容。