精准AI遗忘新突破:多模态敏感信息自动隔离实现
你是否想过,当你和AI闲聊时,无意中把自己的生日、住址或照片告诉了它,这些信息会不会被它记住?我们能否像删除微信聊天记录一样,让AI“忘记”这些隐私?
近日,合肥工业大学教授时增林团队开发出一种“机器遗忘”技术,能让AI安全地忘记你的隐私,同时确保它的其他核心能力完全不受影响。这就像给AI做了一场脑部手术,只精准切除有害的“记忆肿瘤”,而完好的大脑功能被完整保留下来。
这项技术被称为“良性遗忘”,它依赖于一个名为“雕刻性记忆遗忘适配器”的模块,英文简称SMFA。时增林告诉DeepTech:“我们首次在多模态大模型的遗忘问题上,提出了‘有益遗忘’这一概念,并首次定义了对于多模态大模型而言,什么是有益的遗忘能力。同时,我们也首次提供了能够实现这种有益遗忘的方法,即我们的SMFA。”
研究中,团队首先让AI在需要被遗忘的隐私数据上进行训练。不过,这次训练的目标不是学习知识,而是“学习拒绝回答”。他和团队把原本正确的答案(比如一个人的名字叫张三)替换成“我不知道”“我无法提供该信息”等拒绝性答复。通过训练,AI就能学会针对这些特定问题守口如瓶。这个过程中产生的参数更新,被单独打包成为一个叫做“记忆遗忘适配器”的小模块。
然而,仅学会拒绝容易让AI变得对什么都“一问三不知”。为了防止这种过度泛化,时增林等人同时使用了“保留锚点”。他们使用一小部分必须保留的正常知识(比如一些无害的图片和描述)对AI进行微调,借此产生另一组参数更新。这个锚点就像灯塔,指明了哪些知识结构和能力是需要被牢牢保护和坚决不能动摇的。
那么现在,有两股力量在影响AI:一股是要它“忘记”,一股是要它“记住”。SMFA的工作就是仔细分析这两组参数更新,找出其中相互冲突的部分。比如,“遗忘更新”试图改变某个参数,而这个参数的改变方向恰恰会损害“锚点”想要保护的知识。
SMFA则会使用一个巧妙的掩码机制,精准地屏蔽掉那些有害且强势的遗忘更新,只保留那些能够有效实现隐私遗忘但又不过度的更新。最后,将这个“雕刻”好的更新模块,轻轻安装回原始的AI模型之中。
结果就是:AI成功忘记了指定的隐私,问起的时候它会礼貌拒绝或者回答其他无关内容,但是它的“看图说话”和理解能力丝毫没有受损,对于其他该记住的知识也依然可以对答如流。
为了公平、严格地测试各种遗忘方法的优劣,时增林团队还构建了世界上第一个针对多模态大模型选择性遗忘的综合测试基准,命名为S-MLLMUn Bench。
这个基准包含了1000个完全虚构的虚拟人物档案,每份档案都有AI生成的人物图片和详细的文本信息,比如姓名、职业、工资,甚至还有一份眼科医学图像和诊断描述。这样做既测试了隐私保护,又保证了研究能够完全符合伦理。
测试分为三个核心部分:
第一部分是图像记忆遗忘,测试AI是否忘记了指定人物的隐私信息;第二部分是文本记忆遗忘,测试AI是否忘记了与图片相关的文本隐私;第三部分是图像理解保留,测试AI在“动完手术”之后基本的看图说话能力是否依然在线。
在这个高标准考场中,相比其他方法,SMFA在成功擦除隐私记忆的同时,在图像理解保留项目上得分最高,而且生成的拒绝回答通顺、自然、有意义。而一些传统方法要么下手太狠导致AI智力严重下降以至于输出乱码,要么力度不够导致隐私没删干净。
总的来说,SMFA这项研究向我们说明了,人类和AI的共处完全可以建立在更安全、更尊重彼此权利的基础之上。“此外,它还可以用于更新过时信息。比如模型现在将特朗普与美国总统绑定,但几年后总统更迭,模型若仍回答特朗普就错了,这时就需要‘遗忘’过时的信息。”时增林补充称。
他继续说道:“我们觉得仅实现‘遗忘’对于现实问题可能还不够,未来我们希望在遗忘的同时,实现对模型的知识注入。例如,为新的概念提供多样化解释,融入文化多样性。比如‘666’这个词,模型可能只知道它是吉利数字,但网络用语中它还有‘做事顺滑’的意思。我们希望能将这类新知识高效注入模型,可能只需少量数据,而非重新训练整个模型。”
参考资料:
https://arxiv.org/abs/2511.20196
运营/排版:何晨龙
相关攻略
谷歌DeepMind今天扔下了一颗重磅冲击波:正式开源发布Gemma 4系列模型。根据官方说法,这是谷歌迄今为止最智能的开放模型,专为高级推理和智能体工作流而生。最引人注目的是,它号称实现了“单位参数下前所未有的智能水平”——换句话说,就是用更小的模型体量,干出更聪明的活儿。 先看几个硬核数据:其3
当前,视觉语言动作模型(VLA)作为具身智能的核心技术路径,正面临严重的“碎片化”挑战。不同团队采用的动作解码范式各异,数据与训练管线深度绑定,评测标准互不统一,导致研究成果难以横向对比,复现成本高昂,这严重阻碍了领域基础模型的迭代与进步。 针对这一行业痛点,开源项目StarVLA并未选择盲目堆砌算
在OpenClaw应用热潮席卷的当下,一个核心的安全隐患正日益凸显:云端隐私数据保护的缺位。想象一下,你刚向模型输入了一段公司的财务数据,下一秒这条敏感信息可能就已经在云端“裸奔”。这种担忧,正驱使着越来越多的用户将目光投向本地终端,期待能“安全养虾”。然而,端侧设备的有限算力,往往难以高效支撑复杂
AI领域再添重磅工具。MiniMax稀宇科技正式推出MMX-CLI,一款专为AI Agent设计的命令行工具。它极大地简化了AI助手调用多模态能力的流程,无论是代码编写、图像创作还是视频生成,都能通过简洁指令轻松完成,显著提升开发与自动化效率。 根据官方发布的信息,MMX-CLI的核心优势在于“开箱
头图由智象未来AI大模型生成智东西作者 王涵编辑 漠影在演唱会、各大晚会的舞台上,机器人伴舞团以整齐划一、精准卡点的舞姿惊艳全场。这种整齐划一不仅是硬件的胜利,更是“训练有素”的结果。具身智
热门专题
热门推荐
现货持有者坚守仓位,比特币接近115,000水平 近期比特币(BTC)价格接近$115,000水平,市场整体情绪谨慎,但现货持有者依旧坚守仓位,显示出一定的多头信心。 市场现状与资金流动 那么,当前市场的资金究竟在如何流动?分析显示,一个有趣的现象正在上演:短线资金的流入其实相当有限,市场热度并未急
目录 要点介绍:分析师称XRP呈现“最强看涨结构”高位清算集中于2 90美元以上区域 周四,XRP价格稳稳站在了2 80美元上方。这个位置守住了,意味着什么?意味着市场向那个经典的“杯柄形态”目标价——6美元以上——又迈进了一步。 要点介绍: 先看几个核心数据:周四XRP报收2 82美元。技术分析显
近期,以太坊(ETH)衍生品市场经历了短暂的闪崩,但随后价格快速企稳,交易者开始关注关键突破点——$4,500水平。 ETH衍生品市场现状 市场情绪往往在剧烈波动后显露真容。从最新的链上数据和期权、永续合约的交易情况来看,那场短暂的闪崩更像是一次压力测试——结果是,市场波动率显著下降,多空力量似乎进
DOGE单日暴涨11%,交易量激增四倍,市场风向变了? 最近,加密货币市场又热闹起来了。DOGE(狗狗币)上演了一出“旱地拔葱”,价格单日暴涨11%,更关键的是,成交量直接翻了四倍。这种“价量齐升”的场面,无疑给整个迷因币板块打了一针强心剂,市场情绪肉眼可见地回暖了。 DOGE价格拉升原因分析 那么
如何安全获取欧易(OKX)官方APP?一份详尽的下载与使用指南 Binance币安 欧易OKX ️ Huobi火币️ 当人们谈论“欧易易欧”时,指的往往是那个全球顶尖的数字资产交易平台——欧易(OKX)。作为业务版图庞大的行业巨头,其官方APP无疑是用户进行交易、查看行情和管理资产的核心工具。不过,





