CVPR 2026 信通院与清华提出FedRE 联邦学习三难困境的纠缠解法
在联邦学习的实际部署中,我们常常面临一个核心挑战:如何在确保模型高性能的同时,兼顾数据的强隐私保护与可控的通信成本?当各个参与方(客户端)采用的模型架构各异时——例如部分使用CNN,部分使用Transformer——这一难题的复杂性将显著增加。
针对这一痛点,一项由产学研团队联合提出的创新框架,为我们提供了一个极具巧思的解决方案。这项名为“基于表征纠缠的联邦学习”(Federated Representation Entanglement, FedRE)的研究,旨在模型异构的复杂环境下,精准找到模型性能、数据隐私与通信效率三者之间的最佳平衡点。

论文标题:FedRE: A Representation Entanglement Framework for Model-Heterogeneous Federated Learning
论文链接:https://arxiv.org/pdf/2511.22265
代码仓库:https://github.com/AIResearch-Group/FedRE
核心动机:破解模型异构联邦学习的困局
在模型异构的联邦学习场景中,各客户端使用不同的特征提取网络,但目标任务是相同的(如图像分类)。这导致了一个根本矛盾:传统的联邦平均(如FedAvg)等方法因模型参数结构不同而无法直接应用。那么,能否在服务器端训练一个有效的全局分类器,同时避免上传原始数据或产生过高的通信负担?
一种直观的解决方案是上传所有样本的特征向量(表征),例如FedAllRep方法。这种方法虽然可能获得较好的模型性能,但代价是巨大的通信开销和严重的隐私泄露风险——攻击者很可能从这些高维特征中逆向推理出原始敏感数据。
为了降低风险,另一种思路是上传每个类别的“原型”(即类中心特征),例如FedGH方法。这确实节省了通信量并增强了隐私性。但随之而来的问题是:全局分类器如果仅基于这些高度浓缩的类别中心进行学习,容易形成过于尖锐、缺乏泛化能力的决策边界,最终反而损害了模型的整体性能。

正是洞察到这两种路径各自的局限性,FedRE框架提出了一个折中而精巧的方案:上传“纠缠表征”。具体而言,每个客户端不再上传全部特征,也不仅上传单个类原型,而是将本地所有类别的特征,通过随机权重进行混合,生成一个全新的“纠缠”特征向量,并配上一个对应的、融合了原始标签信息的“纠缠”标签编码。
这种做法的优势非常明显:首先,服务器从每个客户端接收的数据量锐减(仅一个向量),通信开销大幅降低。其次,由于这个“纠缠”特征融合了多个类别的信息,攻击者想从中逆向还原出任何一张具体原始数据,难度极高。最关键的是,全局分类器在训练过程中,每次参数更新都能接收到来自多个类别的、动态变化的监督信号,这促使它学习到更平滑、更稳健的决策边界,从而有望实现更优的最终性能。
核心方法:FedRE的三步工作流程
整个FedRE框架的工作流程清晰高效,主要分为三个核心步骤:
第一步:本地模型训练。各客户端利用自身的私有数据集,独立更新本地的特征提取器和分类器参数。

第二步:生成并上传纠缠表征。每个客户端收集本轮所有训练样本经过特征提取器得到的特征,通过随机加权聚合的方式,生成一个唯一的“纠缠表征”及其对应的“纠缠标签编码”,然后将这组高度压缩的知识包上传至中央服务器。
第三步:服务器端训练与模型分发。服务器聚合所有客户端上传的“纠缠知识包”,利用它们来训练或更新全局分类器。训练完成后,将这个性能更强的全局分类器下发给所有客户端,替换其本地分类器,从而开启新一轮的联邦学习协作循环。
实验验证:性能、隐私、开销的全面评估
模型性能表现
在模型异构的标准基准测试中(模型同构的补充结果详见原论文附录),FedRE展现出了极具竞争力的性能。从下表数据可以看出,其整体表现优于同样注重隐私和效率的FedGH等方法。这初步验证了“纠缠表征”作为一种新型知识传递媒介的优越性——它比单纯的“类原型”包含了更丰富、对模型训练更友好的监督信息。

隐私保护能力
隐私保护能力必须通过实际的攻击测试来检验。研究团队针对三种不同的上传数据——原始样本特征、类别原型和FedRE的纠缠表征——分别实施了表征逆向攻击,试图重建出原始图像。
结果对比非常显著:从原始特征可以较清晰地恢复出物体轮廓;从类别原型也能大致推断出类别信息(例如识别出是“鱼”);然而,从FedRE的纠缠表征中重建出的图像,几乎是一片无法辨识的随机噪声。这强有力地证明,多类别信息的深度纠缠与混合,构成了抵御隐私泄露的坚固防线。

通信效率分析
通信效率是联邦学习能否实际落地应用的关键考量。FedRE在这一指标上具备天然优势:在每轮通信的上传阶段,每个客户端仅需传输一个固定维度的纠缠向量,其通信开销远低于上传大量样本特征的方法,与上传类原型的方法相当甚至更优。在服务器广播下载阶段,其开销则与其他主流联邦学习方法保持在同一水平。
总结与未来展望
当前,数据要素的价值释放与隐私安全合规要求正变得日益严格。如何在充分挖掘数据价值与严格保护用户隐私之间,找到一条安全、可行的技术路径,是整个AI行业亟待解决的关键问题。
FedRE框架的提出,正是应对这一挑战的一次创新性尝试。它通过引入“表征纠缠”这一新颖的中间表示形式,在模型异构这一现实且复杂的应用设定下,巧妙地协同优化了模型性能、数据隐私与通信开销。这项研究不仅为联邦学习技术的进一步发展提供了新思路,也为未来构建更安全、更高效的数据协同计算模式奠定了重要的理论基础。
相关攻略
联邦学习面临模型异构时的性能、隐私与通信成本“三难”问题。FedRE框架提出“表征纠缠”方法:客户端将本地多类样本表征随机加权融合为单一纠缠表征上传,使全局分类器学到更平滑的决策边界,提升性能;同时信息高度混合可抵御逆向攻击,保护隐私;每轮仅上传一个向量,大幅降低通信开销,在
在数据价值日益凸显的今天,如何在利用数据训练智能模型的同时,牢牢守住隐私安全的底线,成了横亘在许多行业面前的一道难题。传统的集中式训练需要汇聚各方数据,隐私泄露风险如影随形;而各自为政的孤立训练,又难以获得高质量的全局模型。有没有一种两全其美的方案?联邦学习(Federated Learning,
联邦学习就像多个厨师在各自厨房里做菜,最后把菜谱分享出来,大家一起改进烹饪技艺。但如果有人故意在菜谱里加入有害配方,整个厨师团队都会受到影响。上海交通大学、新加坡国立大学和蚂蚁集团的研究团队针对这个
国家知识产权局信息显示,未来城市(上海)设计咨询有限公司申请一项名为“基于联邦学习的AR场景动态深度学习模型训练与推理方法”的专利,公开号CN121328741A,申请日期为2025年12月。专利摘
热门专题
热门推荐
微信群里的接龙,方便是真方便,但整理起来,那叫一个头疼。手动复制粘贴,不仅耗时费力,还容易出错、遗漏,最后导出的表格格式五花八门,看着就心累。 有没有一种方法,能让这个过程自动化,让数据自己“跑”进表格里?答案是肯定的。借助一些工具,我们可以实现群内接龙数据的自动识别、解析和归档。下面,就来拆解一下
VineCoin(VINE币):重塑创作者经济的区块链新星 在数字资产的浪潮中,VineCoin(VINE币)正作为一个新兴项目崭露头角。它并非又一种简单的代币,其野心在于利用区块链技术,从根本上重塑内容创作与社交互动的经济规则。可以说,它致力于成为一个去中心化生态系统的核心引擎,目标是为全球的内容
ToClaw文件整理术:一键清理桌面杂乱文件的秘籍 | AI智能文件管理教程 利用AI智能助手整理电脑桌面文件,愿景虽好,但在实际应用中,你是否也遇到过分类不准确、指令执行失败,甚至文件被误移的困扰?请放心,这些问题往往源于几个关键的设置步骤尚未完善。掌握以下这套经过验证的ToClaw文件整理优化方
三星电子工会确认原定罢工计划未取消,但将遵守法院禁令,确保罢工不影响正常生产流程。劳资博弈进入微妙阶段,工会需在法律框架内施压,公司生产秩序暂获法律庇护,后续发展取决于双方谈判。
千问AI赋能社群自动化运营:一、关键词触发智能回复;二、定时任务精准推送;三、敏感词实时过滤预警;四、成员标签化智能分组。 社群运营工作繁杂,常常需要处理大量重复性任务,如解答常见问题、发布定时通知、监控群内动态等,这让运营者倍感压力。如何实现高效、智能的社群管理,解放人力?利用千问AI的强大功能,





