游乐游手机版
首页/科技数码/文章详情

840亿AI实验室创新突破:大模型安全管控新方案

时间:2025-09-28 12:11
刚刚,OpenAI前CTO Mira Murati创办的Thinking Machines Lab再次发布成果! 这是他们继《克服LLM推理中的不确定性》(Defeating Nondetermi

OpenAI前首席技术官Mira Murati创办的Thinking Machines Lab再出新成果!

继《征服LLM推理中的非确定性难题》之后,团队发布第二篇重磅论文——《模块流形研究》。

\

完整研究博客:https://thinkingmachines.ai/blog/modular-manifolds/

训练大型神经网络如同"走钢丝",研究人员需要精细调控其内部参数状态,既要防止权重、激活值或梯度这些关键张量数值溢出,又要避免梯度消失的问题。

核心突破点是建立统一的量级管理系统。

基础控制手段方面:

  • Layer Norm技术负责将每层输出调整到合理范围
  • 梯度归一化处理如Muon优化器的谱归一化控制更新幅度

进阶方案涉及直接管控权重张量本身。

研究提出通过对权重矩阵进行归一化,将参数约束在特定子流形上的创新思路,实现了优化算法与流形约束的协同设计。

这使训练过程转变为"预防式"管控:

  • 初始参数即处于最佳区间
  • 训练稳定性显著提升
  • 模型可解释性增强
  • 整体训练效率优化

流形优化器的核心原理

从数学角度看,流形可以被视为局部呈现平坦特性的曲面。

当放大观察时,其局部几何形态与欧几里得空间无异。

流形上某点附近的平坦区域被称为"切空间"。

\

图1展示了三维球面及其切平面的数学表示。

为确保权重始终保持在指定流形内,研究者采用了以下方法:

  1. 使用常规优化器进行参数更新
  2. 通过投影操作将调整后的权重映射回流形

但该方法存在步长效率损失问题:大幅偏离后的强制投影会导致实际参数更新与学习率设定产生偏差。

要设计真正有效的流形训练算法,必须明确切空间的度量标准。研究人员开创性地直接在切空间实施优化,使学习率与参数实际位移精确对应。

\

图2展示了不同距离度量方式对优化方向的影响。

\

图3中粉色箭头表示原始梯度方向,值得注意的是最优更新方向未必与之完全重合。

数学推导过程将约束优化问题转化为: \

引入拉格朗日乘数法求解: \

最终得到的关键方程为: \

完整算法流程如图4所示: \

流形Muon优化器

针对Transformer架构,研究人员特别设计了流形约束方案:

  • 权重矩阵W需满足奇异值全部为1
  • 采用Stiefel流形数学框架
  • 引入谱范数约束最大拉伸效应

\

通过凸优化问题求解: \

采用对偶上升法计算: \

推导得梯度表达式: \

实验结果验证如图6所示: \

模块流形理论

该理论创新性地解决了多层网络的协同优化难题:

  • 建立层间学习率分配机制
  • 通过Lipschitz敏感性分析实现精确控制
  • 保持网络输出的稳定性边界

论文详细信息: https://thinkingmachines.ai/blog/modular-manifolds/

来源:https://36kr.com/p/3485551753272448
上一篇长安马自达EZ-60能否突围中国纯电市场? 下一篇BJ30旅行家8.39万起,空间升级动力强劲,焕新出发
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
女乘客凌晨网约车上排泄后逃逸 司机获赔三千元
科技数码 · 2026-05-30

女乘客凌晨网约车上排泄后逃逸 司机获赔三千元

网约车司机每天起早贪黑,接到的乘客形形色色,按理说早已见惯了各种突发状况。但最近刷到一则令人极度窒息、又无比心疼网约车司机的新闻,真的越看越让人无语。5月27日凌晨3点多,四川南充的网约车司机陈师傅像往常一样跑夜班,接到一名女性乘客。这名乘客竟然在网约车上排便,完事后还若无其事地下车跑了!图源:微博

中国十年研发气固电池 氢能车告别高压风险
科技数码 · 2026-05-30

中国十年研发气固电池 氢能车告别高压风险

中国科学院大连化学物理研究所研发全球首例气-固氢负离子原型电池,以氢气为正极、金属镁为负极,实现常温常压储氢。储氢效率达93 9%,可在-20℃至90℃稳定工作,循环60次容量保持率超70%,为氢能储运提供安全高效新路径。

vivo TWS 5e耳机发布 3色可选55dB混合自适应降噪229元
科技数码 · 2026-05-30

vivo TWS 5e耳机发布 3色可选55dB混合自适应降噪229元

vivoTWS5e耳机全新发布,售价仅为229元,提供留白、墨黑、天青三种配色。单耳仅重4 3克,支持IP54防尘防水。搭载55dB混合自适应降噪及双麦克风AI通话降噪,配备11mm动圈单元,蓝牙5 4,延迟低至仅42ms,配合充电盒总续航可达55小时,性价比极高。

罗永浩新号粉丝破400万 力挺杨笠后逆袭翻盘
科技数码 · 2026-05-30

罗永浩新号粉丝破400万 力挺杨笠后逆袭翻盘

提到罗永浩,他新开通的社交账号粉丝数已经突破400万大关。不愧是“初代网红”中的流量担当,这涨粉速度令人惊叹。粉丝数量攀升后,罗永浩随即宣布将举办抽奖活动,赠送礼物以回馈支持者。图片来源:微博平心而论,这个数据并不令人意外。罗永浩在互联网领域摸爬滚打多年,尽管时常在“争议”与“反转”之间游走,但他对

英伟达微软发布神秘预告PC芯片下周亮相
科技数码 · 2026-05-30

英伟达微软发布神秘预告PC芯片下周亮相

北京时间周六凌晨,微软与英伟达几乎同步在社交媒体上为一款即将于下周亮相的神秘新品造势预热,二者联手的举动引发广泛关注,颇有“联手合作”的意味。 微软方面,Windows与Surface硬件部门执行副总裁帕万·达武鲁里(Pa van Da vuluri)晒出一张照片,隐约可见曲面屏边缘,配文表示:“为