首页 游戏 软件 资讯 排行榜 专题
首页
AI
OpenMythos开源:基于PyTorch复现Claude深度推理架构

OpenMythos开源:基于PyTorch复现Claude深度推理架构

热心网友
87
转载
2026-05-18

关于Anthropic那个神秘的Claude Mythos,业内一直有各种传闻。它在复杂推理和系统性泛化上的表现据说相当惊人,但始终闭源,让人只能猜测其内部机制。现在,情况有了新变化。

一个名为OpenMythos的项目刚刚出现,它从第一性原理出发,用PyTorch完整实现了一套对Claude Mythos架构的大胆理论重建。这并非简单的复制,而是基于近期循环变换器相关论文的一次深度探索,试图揭开那个“神话级”模型的面纱。

Claude Mythos 到底是什么?核心猜想:循环深度变换器(RDT)

要理解OpenMythos的假设,得先看看传统Transformer的局限。通常,想增加模型深度,就得堆叠更多层。但OpenMythos提出了一个完全不同的思路:Claude Mythos很可能是一种循环深度变换器。

它的核心想法很巧妙——让同一个Transformer块在单次前向传播中循环执行多次,权重完全共享。这样一来,就能用更少的参数,撬动更深的推理深度。具体来看,这个架构可以分为三个清晰的阶段:

前奏(Prelude):这是一个标准的Transformer层,只运行一次,负责对输入进行初始处理,打好基础。

循环块(Recurrent Block):这里是架构的心脏。同一个块会反复循环执行。为了防止循环过程中信息衰减或崩溃,每次循环都会通过一种稳定的线性时不变输入注入机制,将原始输入重新融合到隐藏状态中。这个块内部还有更多设计:前馈网络采用了混合专家模式,每次只激活稀疏的top-K专家,同时保留少量共享专家。关键在于,不同的循环深度会路由到不同的专家子集,这让每一次“思考”迭代都具有计算上的独特性,而非简单重复。注意力机制则默认采用类似DeepSeek-V2的多潜在注意力,通过低秩键值缓存,据说能大幅降低内存占用。

结尾(Coda):最后一个标准层,只运行一次,负责输出最终结果。

此外,项目还引入了多项旨在提升稳定性的机制,比如自适应计算时间,让模型自己动态决定何时停止循环;以及深度方向的LoRA适配器,为不同迭代提供额外的表达能力,又不显著增加参数总量。

为什么这可能碘伏现有 scaling law?

传统模型的扩展,主要围绕着增加参数数量和训练数据量。但OpenMythos所探索的路径,引入了一个新的维度:推理时的循环深度。根据相关论文和实验,一个仅拥有7.7亿参数的循环模型,在相同数据条件下,性能可以媲美13亿参数的标准模型。这意味着,推理深度本身成了一种可以动态调节的计算资源——模型在训练时可能只学习了20跳的推理,但在实际应用时,将循环增加到30跳依然有效。

Image

这与目前常见的思维链技术有本质区别。所有的推理过程都在连续的潜在空间中完成,不产生中间的文字标记,这有可能带来更好的系统性泛化和组合推理能力。简而言之,参数复用加上循环思考,可能等于更高效的深度推理。这或许也能解释,为什么Claude Mythos在应对硬核问题时,会给人“特别强”的直观感受。

OpenMythos 项目亮点

这个开源项目提供了一套完整且可配置的PyTorch实现,包含了混合专家、前馈网络、注意力等核心模块。它不仅提供了清晰的架构图和代码示例,还包含了用于研究的训练基线,强调可复现性,极大方便了社区对循环动态、缩放规律以及推理时深度调整进行实验和探索。

这对 AI 未来意味着什么?

尽管OpenMythos是基于理论的重建,并非Anthropic的最新机密,但它确实将“循环推理”这个前沿方向推到了舞台中央。它暗示了一种未来:模型的扩展可能不再仅仅比拼参数规模,而是比拼“如何更聪明地思考”——即在推理阶段动态、灵活地增加计算深度,而非一味地增大静态参数。

对于不同角色的从业者而言,这都意味着新的机会:AI研究者可以直接使用代码,验证循环结构与堆叠层结构的效果差异;开发者可以尝试将类似机制集成到自己的项目中,观察其在长链推理、复杂规划等任务上的提升;而对于广大AI爱好者来说,这无疑是见证开源社区快速迭代、挑战前沿的又一个生动案例。

当然,这一切都处于早期探索阶段。训练稳定性、梯度传播等工程挑战,仍需社区共同努力去攻克。但正如项目发起者所言,这是一项开放的研究努力,欢迎所有人的参与和贡献。

循环深度会成为下一代大模型的核心趋势吗?还是只是一个美好的理论猜想?这个问题,或许需要更多实践来回答。

来源:https://www.51cto.com/article/841103.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Karpathy LLM Wiki本地部署教程 有道云笔记与Claude Code实践指南
AI
Karpathy LLM Wiki本地部署教程 有道云笔记与Claude Code实践指南

你的手机里是不是存了几百篇“稍后再看”的文章?笔记软件里是不是躺着上千条收藏,落满了数字灰尘,再也未曾打开。 别不好意思,这几乎是数字时代每个人的通病。每天面对海量的行业报告、技术文章和灵感碎片,我们总在重复“收藏即遗忘”的动作。标签、文件夹、搜索功能,在信息量突破某个临界点后,便彻底失灵了。我们以

热心网友
05.17
Claude技能编写避坑指南:从入门到精通实战教程
AI
Claude技能编写避坑指南:从入门到精通实战教程

设计Claude Skills时,许多开发者容易陷入一个认知误区:认为功能越全面、指令越“智能”,最终效果就越好。然而实践往往证明恰恰相反。以下七个常见的设计陷阱,正是导致技能输出不稳定、难以复用的根本原因。我们将以具体的“Figma UI设计审计”技能为例,深入剖析如何有效避开这些陷阱,从而构建出

热心网友
05.17
Claude API 压力测试脚本自动化生成指南
AI
Claude API 压力测试脚本自动化生成指南

面对图像生成类API的高并发压力测试需求,手动编写脚本不仅耗时费力,还容易引入人为错误。如今,借助Claude等AI助手强大的自然语言理解与代码生成能力,我们可以快速构建出精准、可执行的性能测试方案。以下五种自动化实现路径各具特色,能够帮助测试工程师和开发者灵活应对不同技术场景与安全要求。 一、使用

热心网友
05.17
ChatGPT卸载量激增413% Claude下载量暴涨100% 奥特曼帝国现裂痕
业界动态
ChatGPT卸载量激增413% Claude下载量暴涨100% 奥特曼帝国现裂痕

AI领域传来一则重磅消息。 4月29日,有消息称Anthropic正在进行新一轮融资谈判,其估值可能突破9000亿美元大关。 如果交易最终完成,这家成立尚不足四年的公司,将一举超越OpenAI,成为全球估值最高的AI独角兽。 9000亿美元。这个数字意味着什么? 放在A股市场,它超过了贵州茅台的市值

热心网友
05.17
Claude代码助手使用入门与实战教程
AI
Claude代码助手使用入门与实战教程

Claude Code的诞生,标志着AI工具从“对话应答”迈入了“自主执行”的新纪元。简而言之,它能将您的自然语言指令,直接转化为计算机上的具体操作。其高级能力更在于,可以协调多个智能体,如同一个专业团队般并行处理复杂项目的不同模块。 Claude Code是一款在终端中运行的AI智能体工具。“终端

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币巨量流出CEX 24小时超5740枚 市场抄底信号显现
web3.0
比特币巨量流出CEX 24小时超5740枚 市场抄底信号显现

过去24小时全球主要交易所比特币流向分化明显,整体净流出5740 82枚。其中CoinbasePro流出约5457枚,币安、Gemini分别流出1023枚和504枚;而OKX则逆势录得约530枚净流入。

热心网友
05.18
魔兽世界恶魔的气息任务全流程攻略与完成步骤详解
游戏攻略
魔兽世界恶魔的气息任务全流程攻略与完成步骤详解

卡拉赞的“恶魔的气息”任务需向大法师奥图鲁斯领取,随后击败玛克扎尔王子并回提交还。任务奖励包括金币、经验与声望。

热心网友
05.18
魔力宝贝狗洞位置详解与前往路线指南
游戏攻略
魔力宝贝狗洞位置详解与前往路线指南

《魔力宝贝》中“狗洞”即“奇怪的洞窟”,位于亚留特村西南方向黄色传送石处,是12至20级玩家高效练级地点。前往路线为:从法兰城至伊尔村,向北进入哈巴鲁东边洞窟击败“熊男”,穿越后抵达亚留特村,再向西南探索即可找到入口。洞内怪物等级较高,建议携带“风地”属性水晶提升生存能力。

热心网友
05.18
贾跃亭获7000万美元融资 将推进多年造车计划
业界动态
贾跃亭获7000万美元融资 将推进多年造车计划

时隔七年,贾跃亭以CEO身份重掌法拉第未来(FF)帅印,并成功为公司注入了关键的发展动力。近期,FF累计完成了高达7000万美元的机构融资。这笔至关重要的资金,被贾跃亭定位为驱动公司机器人业务实现第一阶段战略目标的“核心粮草”。 随着资金与团队就位,贾跃亭的信心显著增强。他公开立下目标:将用两年时间

热心网友
05.18
原神修复水道任务攻略法沙利亚的狂想曲通关详解
游戏攻略
原神修复水道任务攻略法沙利亚的狂想曲通关详解

任务需修复两条水道。首先跟随指引找到NPC并进入幻境,使用号角对准壁画激活飞鸟幻影,触碰并跟随其路径即可修复第一条水道。第二条水道位于洞xue内,跟随萤火虫找到入口,重复使用号角并借助弹跳水母到达高处,跟随飞鸟完成修复。完成后可获得奖励并推进剧情。

热心网友
05.18