游乐游手机版
首页/科技数码/文章详情

谷歌嵌套学习实现AI持续进阶,解决灾难性遗忘难题

时间:2025-11-10 19:49
谷歌研究院近日在机器学习领域取得重要突破,针对大语言模型持续学习时面临的“灾难性遗忘”难题,提出名为“嵌套学习”的全新范式,相关成果已发表于国际顶级会议NeurIPS 2025。传统大语言模型虽具备

谷歌研究院近期在机器学习领域实现重要突破,针对大语言模型持续学习时面临的"灾难性遗忘"难题,提出名为"嵌套学习"的全新范式,相关成果已发表于国际顶级会议NeurIPS 2025。

传统大语言模型虽具备强大能力,但知识获取方式存在显著局限。其知识体系主要依赖预训练阶段的静态数据,或受限于有限的上下文窗口长度,无法像人类大脑般通过"神经可塑性"机制动态更新知识——即根据新经验调整认知结构而不丧失原有能力。当直接用新数据覆盖旧模型时,常出现新任务表现提升但旧任务性能断崖式下降的"灾难性遗忘"现象。

研究团队提出的嵌套学习范式,通过重构机器学习模型的底层架构解决了这一矛盾。该范式将复杂模型视为多层次嵌套的优化问题集合,每个子问题拥有独立的"上下文流"和更新节奏。这种设计突破了传统模型架构与优化算法分离的局限,为构建计算深度更强的AI组件提供了新维度。

基于该理论框架,研究团队开发了两项关键技术:一是"深度优化器",通过将优化过程本身转化为可学习模块,并优化其目标函数设计,使模型对数据噪声和分布变化具有更强适应性;二是"连缀体内存系统",该系统将模型记忆分解为多个更新频率不同的模块,形成从短期到长期的平滑过渡,构建出更高效的持续学习内存架构。

为验证理论有效性,团队构建了名为"Hope"的概念验证模型。该模型基于Titans架构设计,通过自修改循环网络深度整合连缀体内存系统,实现多层级上下文学习。实验数据显示,在语言建模和常识推理任务中,Hope模型的困惑度指标较现代循环模型和标准Transformer显著降低,准确率大幅提升。

在针对长文本处理能力的"大海捞针"测试中,Hope模型展现出卓越优势。该测试要求模型从超长文本中精准定位并回答特定问题,实验结果表明,连缀体内存系统能有效处理超长信息序列,为开发具备持续学习能力的AI系统提供了关键技术路径。

据了解,"大海捞针"测试是评估大语言模型长文本理解能力的重要基准,通过模拟从海量信息中提取关键内容场景,验证模型在真实应用场景中的信息检索可靠性。此次突破标志着AI模型向"温故知新"的类人学习能力迈出重要一步。

来源:https://www.itbear.com.cn/html/2025-11/1015356.html
上一篇iPhone 17系列激活量825万:Pro Max领跑,Air遇冷 下一篇iPhone卫星功能升级:第三方API支持离线地图导航
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个