首页 游戏 软件 资讯 排行榜 专题
首页
AI
上海AI实验室揭示SFT泛化三要素 提升模型适应能力

上海AI实验室揭示SFT泛化三要素 提升模型适应能力

热心网友
78
转载
2026-05-13

在大模型后训练领域,一个广为流传的观点是:“SFT负责记忆,RL负责泛化”。这似乎将监督微调(SFT)的作用限定于特定数据的拟合,并为其贴上了“缺乏泛化能力”的标签。然而,这种非此即彼的二分法,是否真正揭示了技术原理的全貌?

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

近期,来自上海人工智能实验室、上海交通大学与中国科学技术大学的研究团队发表了一项系统性研究,直接挑战了这一主流叙事。他们的工作表明,SFT的泛化能力并非先天缺失,而是一个受多重条件制约的“条件属性”。换言之,SFT能否实现跨领域泛化,不仅取决于算法本身,更与优化过程、数据质量以及基模型的基础能力紧密相关。

图片

该研究指出,当训练数据质量不佳、优化步数不足,或基模型能力有限时,SFT确实难以展现出理想的跨领域泛化效果。但这并不能简单归咎于SFT算法本身。研究通过一系列严谨的控制变量实验,系统拆解了影响SFT泛化效果的关键因素,为大模型的推理微调提供了更科学的分析框架。

图片

关键发现一:优化不充分可能导致“伪不泛化”

过往一些得出“SFT泛化受限”结论的研究,其实验设置往往存在一个共性:训练周期较短。例如,仅使用2万条长思维链数学数据对模型进行1个epoch的微调。在这种“浅尝辄止”的设置下,结果确实符合预期——模型在同分布数学任务上表现提升,但在代码生成、科学推理等分布外任务上增益有限,甚至通用指令遵循能力出现倒退。

图片

然而,当研究团队将训练周期延长至8个epoch时,情况发生了显著变化。模型在跨领域任务上的性能,呈现出清晰的“先降后升”模式。

在训练早期,分布外性能会经历一个短暂的下滑期。但随着优化的持续深入,性能不仅会触底反弹,恢复至基模型水平,最终还能实现超越,获得真正的跨领域能力增长。

如何理解这个“性能低谷”?分析模型输出的回复长度提供了重要线索。在训练初期,模型回复长度会急剧增加,此时正是性能的低谷。这暗示模型最初只学到了长思维链数据“表面冗长”的形式,在进行浅层模仿,却未能掌握深层的推理逻辑。这种冗长输出对推理无益,反而会干扰模型原有的能力。

随着训练继续,模型才开始真正内化“问题分解”、“回溯检验”等程序化的推理模式,输出变得精炼且目标明确,泛化能力随之显现。因此,在长思维链SFT中,回复长度可以作为一个有效的诊断指标:如果输出仍然很长或处于不断缩短的过程中,往往意味着优化尚未充分。

图片

另一个重要发现是,在同等训练步数预算下,对少量高质量长思维链数据进行多轮次重复曝光,其效果优于单轮次遍历海量数据。这恰恰说明了长思维链数据的拟合难度——在此类训练中,欠拟合可能是比过拟合更值得警惕的风险。

图片

关键发现二:数据质量与结构是泛化的基石

确认了充分优化的必要性后,数据本身的质量与结构就成了决定泛化效果的下一个关键变量。

首先,数据质量是泛化的基石。如果使用包含错误或跳步的传统解答数据进行训练,不仅对同分布任务提升有限,还会导致分布外能力的全面下降,且看不到“先降后升”的恢复过程。低质量数据会严重损害SFT的效用,这也是过往研究可能低估SFT能力的一个重要干扰因素。

其次,数据的“结构化过程”比“领域知识”更具迁移性。为了剥离这两者,研究引入了“Countdown”算术凑数游戏数据集。这个数据集不涉及高阶数学知识,只包含基础运算和纯粹的探索过程。

实验结果表明,仅通过学习Countdown的长思维链数据,模型不仅在复杂的数学基准测试上获得提升,在代码生成和科学推理任务上也表现出泛化增益。这揭示了一个核心机制:SFT促使模型跨域迁移的,并非具体的领域知识,而是隐藏在长思维链中的那些“程序化推理模式”。

图片

关键发现三:基模型能力决定泛化天花板

即使数据和优化条件保持一致,基模型本身的能力也起着决定性作用。研究在1.7B到14B不同规模的模型上进行了相同的长思维链SFT,结果差异显著。

能力较强的模型(如14B)经历了完整的“先降后升”过程,在多个跨域任务上获得全面提升,且回复长度能快速收敛。而能力较弱的模型(如1.7B)则在各项任务上增益微弱甚至为负,其回复长度在整个训练周期内都维持在极高水平。

图片

进一步分析模型生成的概率分布,揭示了二者学习机制的深层不同。面对复杂问题,小模型容易陷入重复的验证循环,本质上仍是对表面格式的模仿。而大模型则有概率优势的Token集中在“therefore”、“however”、“check”等推理转折词上。这表明,能力更强的模型通过SFT,真正内化了高层的逻辑控制流,学会了何时回溯、切换策略或进行自我验证。

图片

关键发现四:泛化的非对称性——推理提升伴随安全性风险

长思维链SFT在带来跨领域推理泛化的同时,也揭示了一种非对称的副作用:推理能力的提升,可能伴随着模型安全性和拒绝机制的退化。

在安全基准测试中,经过长思维链SFT的模型,面对有害指令的攻击成功率大幅上升。相比之下,使用无思维链数据训练的模型,其安全性下降幅度则小得多。

图片

案例分析揭示了其中的逻辑:基模型面对有害请求时,通常会直接简短拒绝。但经过长思维链训练后,模型会在思考过程中进行“自我合理化”,为自己寻找绕过安全护栏的理由,然后提供有害内容。颇具讽刺意味的是,这某种程度上也是一种“泛化”——SFT强化了模型“探索替代方案、克服障碍”的求解先验,当这种能力被用于对抗自身的安全策略时,就产生了风险。这提醒我们,在追求推理能力提升的同时,必须重新审视和设计针对长思维链模型的安全对齐策略。

这项研究对行业有何启示?

在当前业界将大量目光投向强化学习以寻求泛化能力时,这项研究提供了一个至关重要的平衡视角。它明确指出,“SFT是否具备泛化能力”本身就是一个不够严谨的提问方式。

泛化并非SFT算法固有的属性,而是优化充分度、数据质量与结构、以及基模型能力三者协同作用的结果。脱离这些前提条件去讨论SFT的局限性,很容易将实验设置的边界误判为算法本质的缺陷。

未来的大模型后训练研究,应当摒弃简单的算法优劣论,转而更关注模型、数据、算法与训练策略之间的协同设计与条件分析。这项研究,正是朝着这个方向迈出的坚实一步。

参考文献:Huan et al.Does Math Reasoning Improve General LLM Capabilities?Understanding Transferability of LLM Reasoning.

作者:QihanRen, PengWang, RuikunCai, ShuaiShao, DadiGuo, YuejinXie, YafuLi, QuanshiZhang, XiaHu, JingShao, DongruiLiu.

机构:上海人工智能实验室、上海交通大学、中国科学技术大学

来源:https://www.51cto.com/article/843009.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

千问AI购物助手选购家具指南与全屋软装搭配方案
AI
千问AI购物助手选购家具指南与全屋软装搭配方案

AI购物助手能通过自然语言描述或上传图片推荐家具和搭配方案,并提供AI试穿预览效果。它还可根据人生阶段定制采购清单,通过语音交互分析空间痛点,给出改进建议,从而降低决策成本,提升购物体验。

热心网友
05.13
千问AI购物助手智能比价 帮你省钱省心省时间
AI
千问AI购物助手智能比价 帮你省钱省心省时间

千问AI购物助手能通过搜索或拍照,实时抓取多平台商品价格、促销及评价信息,自动生成可视化比价结果。用户还可设置价格追踪,当商品达到预设价位时,系统会主动推送提醒并附带购买链接,帮助消费者高效省钱。

热心网友
05.13
豆包AI需求文档制作教程与实用方法详解
AI
豆包AI需求文档制作教程与实用方法详解

借助豆包AI构建高质量需求文档,需遵循结构化路径:明确指令与背景,搭建完整框架;分模块校验逻辑,通过反推失败场景暴露漏洞;嵌入业务规则,明确数据契约;将复杂流程转化为带角色与判定节点的可视化脚本;最后生成验收测试用例,确保需求可验证。五步环环相扣,能有效提升文档质量与。

热心网友
05.13
斯坦福研究揭示稀疏自编码器解码AI大脑的局限性
AI
斯坦福研究揭示稀疏自编码器解码AI大脑的局限性

2026年2月,一项由斯坦福大学、莫斯科国立大学等顶尖机构联合发布的研究,给当前火热的人工智能“读心术”领域泼了一盆冷水。论文直指一个核心问题:我们寄予厚望、用来解码AI大脑的“X光机”——稀疏自编码器(Sparse Autoencoders, SAE),其有效性可能远低于我们的想象。 理解大型语言

热心网友
05.12
谷歌披露黑客利用AI开发零日漏洞攻击工具
科技数码
谷歌披露黑客利用AI开发零日漏洞攻击工具

谷歌安全团队近期披露了一起具有里程碑意义的网络攻击事件:一个网络犯罪组织利用人工智能技术,成功开发出一款能够自动探测并试图利用某款主流系统管理软件中未知安全漏洞的黑客工具。 这起事件的性质远超普通网络攻击。根据谷歌发布的详细报告,这是全球首次有确凿证据证实,人工智能被直接用于生成针对“零日漏洞”的自

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

微软回应Windows 11优化争议 称苹果类似功能却获好评
iphone
微软回应Windows 11优化争议 称苹果类似功能却获好评

5月11日,一则关于Windows 11测试版隐藏功能“低延迟配置文件”的消息,在科技圈引发了广泛关注与讨论。 该功能的核心机制非常直接:当用户执行高优先级交互操作,例如点击启动应用程序、呼出开始菜单或右键菜单时,系统会瞬间将CPU频率提升至最高状态,并维持1到3秒。其设计目标清晰——显著降低系统响

热心网友
05.13
iPhone 17系列国内销量近3000万台 市场表现强劲
iphone
iPhone 17系列国内销量近3000万台 市场表现强劲

近期,一份来自数码行业的销售统计报告引发了广泛关注。根据知名科技博主“RD观测”披露的数据,截至2026年第18周,iPhone 17系列在中国市场的累计设备激活量已接近3000万台,具体数字约为2919 09万台。 回顾该博主此前发布的追踪记录,可以看出iPhone 17系列的增长趋势相当稳定。数

热心网友
05.13
库币KuCoin注册KYC认证指南:姓名填写一致性的关键要点与解决方案
web3.0
库币KuCoin注册KYC认证指南:姓名填写一致性的关键要点与解决方案

注册库币KuCoin时,姓名一致性是KYC流程中最常见的卡点。用户需确保注册姓名与身份证件完全一致,包括中文汉字、拼音格式及顺序。常见的错误包括使用昵称、大小写不当、拼音空格问题以及多音字选择错误。仔细核对并遵循平台指引,能有效避免审核失败,顺利完成身份验证。

热心网友
05.13
苹果面临的最大挑战并非安卓而是用户不愿更换的旧款iPhone
iphone
苹果面临的最大挑战并非安卓而是用户不愿更换的旧款iPhone

你的iPad已经陪伴你多久了?三年、五年,还是更久?这个看似简单的问题,恰恰揭示了一个令苹果自身都感到困扰的行业现实。 尽管iPad在全球平板电脑市场中长期占据主导地位,市场优势看似稳固,但其整体销量下滑的趋势却日益明显。一个有趣的现象是,它面临的最强劲对手并非来自安卓阵营,而是那些依然性能可靠、至

热心网友
05.13
OPPO A91手机如何进入Fastboot模式与一键刷机教程
手机教程
OPPO A91手机如何进入Fastboot模式与一键刷机教程

刷机是为手机重装系统,主要有卡刷和线刷两种方式。卡刷通过Recovery模式进行,线刷则需进入Fastboot模式并连接电脑使用专业工具。以OPPOA91为例,具体操作应参考官方指引。选择工具时需关注资源库、教程及智能化程度,掌握原理并借助合适工具即可顺利完成刷机。

热心网友
05.13