首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
开源AI模型数据库Models.dev由OpenCode团队发布

开源AI模型数据库Models.dev由OpenCode团队发布

热心网友
49
转载
2026-05-11

对于AI开发者而言,选择合适的模型正日益成为一项耗时耗力的信息检索工作。OpenAI、Anthropic、Google、Meta等主流厂商的模型规格、定价策略和能力边界分散在各处,横向对比意味着在无数个浏览器标签页之间反复切换。精确估算项目成本更是令人头疼的难题。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

幸运的是,Models.dev 提供了一个极为优雅的解决方案,有效解决了这一痛点。

Models.dev是什么

简而言之,Models.dev 是 OpenCode 团队开源的一个AI模型“中央数据库”。其核心目标是将市面上主流AI厂商的模型信息,以标准化的方式进行整合与呈现。

该项目采用TOML格式组织数据,全面覆盖了模型价格、上下文窗口长度、是否支持工具调用、知识截止日期等关键规格参数。最便捷的是,所有数据都通过一个公开的JSON API(models.dev/api.json)提供,开发者可以直接调用,轻松集成到自己的模型选型工具或成本计算器中。这相当于为整个AI开发生态构建了一个统一、透明的模型信息查询层。

Models.dev的主要功能

该项目的核心价值,具体体现在以下几个实用功能上:

  • 一站式模型信息查询:收录了数十家主流厂商的基础对话模型和垂直领域模型。开发者无需再为查询一个参数而在多个官网间疲于奔命。
  • 精确成本估算:这是其核心优势之一。数据库详细记录了每个模型输入、输出、推理、缓存读取/写入的每百万token成本(美元计价),甚至包括音频输入输出的成本。项目预算估算从此有了可靠的数据依据。
  • 能力规格对比:通过标准化字段,清晰展示模型是否支持工具调用、思维链推理、结构化输出、温度控制、文件附件等高级功能,并列明知识截止日期、上下文窗口、最大输入输出token数、支持模态等硬性指标。模型对比选型变得一目了然。
  • 公开 JSON API:所有数据均可通过models.dev/api.json接口直接获取。这意味着开发者可以基于此构建自己的模型管理面板、智能选型助手,或将实时价格数据嵌入内部系统。
  • 提供商 Logo 获取:通过models.dev/logos/{provider}.svg这样的简单接口,即可直接获取各厂商的官方Logo,方便在自家产品中进行展示。
  • 社区协作维护:所有数据均以TOML格式按提供商分类存储,并开源在GitHub上。这种开放模式鼓励社区共同贡献和修正,确保了数据库能够跟随AI行业的快速迭代而持续更新。

Models.dev的技术原理

需要特别说明的是,原文中关于“技术原理”的部分,描述的是另一个名为“OpenMythos”的循环Transformer模型架构,而非Models.dev这个数据库项目本身。这里可能存在信息混淆。Models.dev作为一个数据服务项目,其技术重点在于数据抓取、标准化和API服务,而非模型架构。因此,以下对原文该部分内容进行保留性转述,但需明确这并非Models.dev的核心:

  • 三阶段循环架构:输入经Prelude(标准Transformer层)编码后,进入Recurrent Block循环迭代T次,最后由Coda输出;每次循环通过注入原始输入防止隐状态漂移。
  • 隐式思维链:每次循环等效于一步Chain-of-Thought推理,但在连续潜空间静默运行,不输出中间token;支持同时编码多条推理路径。
  • LTI稳定约束:将循环视为线性时不变系统,通过参数化保证谱半径小于1,从根本上解决训练不稳定的问题。
  • MoE+循环协同:MoE提供跨领域广度,循环机制提供推理深度;隐藏状态在循环中演化时,路由器可能选择不同专家子集。
  • 自适应停止:支持ACT机制,模型动态决定何时停止循环,避免“过度思考”。

如何使用Models.dev

同样,此部分“如何使用”也是针对“OpenMythos”模型的,而非Models.dev数据库。Models.dev的使用方式主要是通过其网站查询或调用其API。为保持原文信息完整,此处仍作转述:

  • 安装pip install open-mythos,可选[flash]启用Flash Attention 2。
  • 配置:选择mlagqa注意力类型,使用MythosConfig设置维度、头数、循环次数等参数。
  • 创建模型OpenMythos(cfg)初始化网络。
  • 推理生成:调用model.generate(max_new_tokens=8, n_loops=8),通过n_loops控制推理深度。
  • 训练:使用training/3b_fine_web_edu.py脚本,单卡直接运行或多卡通过torchrun启动。

Models.dev的关键信息和使用要求

此部分继续针对“OpenMythos”模型:

  • 环境:Python + PyTorch;Flash Attention 2需CUDA与编译工具链。
  • 分词器:使用openai/gpt-oss-20b分词器。
  • 精度:H100/A100推荐bfloat16,旧GPU使用float16 + GradScaler。
  • 训练配置:AdamW优化器,线性warmup 2000步后余弦衰减,目标约30B tokens。
  • 规模覆盖:从1B实验模型到1T理论配置均有预定义参数。

Models.dev的核心优势

此部分描述的是“OpenMythos”模型架构的优势:

  • 参数高效:k层循环L次等效于kL层固定深度网络,参数量仅k层规模,内存不随推理深度增长。
  • 推理可扩展:测试时增加循环次数即可提升推理能力,遵循可预测的饱和指数衰减规律。
  • 训练稳定:LTI约束机制彻底解决循环模型训练不稳定和损失尖峰问题。
  • 系统泛化:在分布外(OOD)组合推理上表现优异,通过“顿悟”式三阶段过程实现能力跃迁。
  • 深度外推:训练5步推理链,测试时可成功扩展至10步, vanilla Transformer则失败。

Models.dev的项目地址

  • 项目官网:https://models.dev/
  • GitHub仓库:https://github.com/anomalyco/models.dev

Models.dev的同类竞品对比

这里的竞品对比,实际上是在比较“OpenMythos”模型与其他主流开源模型:

维度 OpenMythos DeepSeek-V3 Qwen2.5
核心架构 循环深度Transformer(RDT) MoE Transformer Dense / MoE Transformer
注意力机制 MLA / GQA 可切换 MLA GQA
循环推理 核心特性(潜空间隐式CoT)
开源程度 完全开源(代码+训练脚本+文档) 开源权重 开源权重
模型规模 1B – 1T 预配置 671B(总参) 0.5B – 72B 等
产品定位 研究验证 / 理论复刻 生产级通用模型 生产级通用模型
推理扩展 增加循环次数扩展深度 固定层数 固定层数

Models.dev的应用场景

此部分描述的依然是“OpenMythos”模型的研究应用场景:

  • AI架构研究:验证循环Transformer、隐式推理链与测试时计算扩展理论。
  • 注意力机制实验:对比MLA与GQA在循环架构下的KV缓存效率与推理质量。
  • MoE研究:测试稀疏专家路由与循环深度结合对多领域任务的影响。
  • 模型训练:基于开源代码和脚本,在FineWeb-Edu等数据集上从头训练自定义规模模型。
  • 稳定性研究:验证LTI约束、谱半径控制与连续深度批处理等技术的实际效果。

总而言之,Models.dev项目精准地切入了一个真实且普遍的需求缝隙,通过提供标准化、可编程访问的模型元数据,为开发者扫除了选型阶段的一大障碍。而文中混编介绍的OpenMythos模型,则展示了一种在架构层面追求更高推理效率和深度扩展性的前沿探索。两者分别从“信息基础设施”和“底层架构创新”的角度,回应了当前AI开发中的不同挑战。

来源:https://ai-bot.cn/models-dev/
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

开源AI模型数据库Models.dev由OpenCode团队发布
业界动态
开源AI模型数据库Models.dev由OpenCode团队发布

对于AI开发者而言,选择合适的模型正日益成为一项耗时耗力的信息检索工作。OpenAI、Anthropic、Google、Meta等主流厂商的模型规格、定价策略和能力边界分散在各处,横向对比意味着在无数个浏览器标签页之间反复切换。精确估算项目成本更是令人头疼的难题。 幸运的是,Models dev 提

热心网友
05.11
Spring Boot 构造器异常排查与Model参数正确使用指南
编程语言
Spring Boot 构造器异常排查与Model参数正确使用指南

在SpringMVC控制器中,错误地对`Model`接口参数同时使用`@RequestBody`和`@ModelAttribute`注解会导致构造器异常。正确做法是将`Model`作为无需任何注解的普通方法参数,并确保其位置在需要数据绑定的对象参数之后。`Model`是框架提供的视图数据容器,不应尝试实例化或绑定请求数据。处理表单提交时使用`@ModelAt

热心网友
05.10
特斯拉Model SX签名版交付延期致车主损失数千美元
iphone
特斯拉Model SX签名版交付延期致车主损失数千美元

特斯拉临时推迟了原定于5月12日举行的ModelS X签名版交付活动,仅通过一封简短邮件通知了350名受邀车主,且未说明原因或提供新日期。此次活动推迟导致许多已提前预订机票、酒店并请假跨州前往的车主蒙受数千美元经济损失,且多数费用无法退款。这批支付了约15 9万美元购车的忠实车主对特斯拉缺乏解释和

热心网友
05.10
特斯拉Model 3与Y高性能版新增免费冰河蓝配色
iphone
特斯拉Model 3与Y高性能版新增免费冰河蓝配色

特斯拉在美国市场为Model3和ModelYPerformance高性能版新增了“冰河蓝”外观配色,该配色此前为ModelS X旗舰车型专属。新车色呈现浅色金属蓝质感,选配无需额外加价。目前,这一更新仅限美国市场,是否会引入中国地区尚不明确。此举旨在提升高性能车型的个性化选项,满足用户对外观

热心网友
05.10
ThinkPHP模型隐藏敏感字段操作方法详解
编程语言
ThinkPHP模型隐藏敏感字段操作方法详解

ThinkPHP模型的$hidden属性仅在toArray()或toJson()序列化时生效,用于隐藏指定字段。它不影响数据库查询,且字段名需严格匹配。直接操作模型属性、使用Db门面查询或json_encode()会绕过此机制。关联模型需独立配置。建议采用$visible白名单模式进行更安全的字段控制。

热心网友
05.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

混音青春迷你相机快速组装方法与成就攻略详解
游戏攻略
混音青春迷你相机快速组装方法与成就攻略详解

在热门游戏《混音青春》中,特殊成就系统为玩家提供了丰富的挑战乐趣。其中,“无须说明”成就以其独特的玩法设计吸引了众多玩家——它要求你在15秒的限时内,快速完成一台迷你相机的完整组装。 无须说明成就怎么做 该成就的核心通关条件非常清晰:你需要在15秒内成功组装好迷你相机。 这个限时组装小游戏会在主线章

热心网友
05.11
欧易OKX订单撤销教程:下错单后如何快速取消与补救指南
web3.0
欧易OKX订单撤销教程:下错单后如何快速取消与补救指南

在欧易OKX交易时,下错订单是常见情况。撤销操作并非全局统一,而是分散在交易页面的不同区域。本文详细介绍了在普通交易、策略委托以及资金账户等关键页面如何找到并执行撤销操作,帮助用户在误操作后及时补救,避免不必要的损失。

热心网友
05.11
OKX交易所App安全下载指南 安卓iOS官网与浏览器下载教程
web3.0
OKX交易所App安全下载指南 安卓iOS官网与浏览器下载教程

本文详细介绍了获取欧乙官方应用的安全渠道,包括官网直接下载、应用商店搜索及版本更新入口。重点分析了安卓系统浏览器下载权限的开启方法,并探讨了不同系统版本对应用兼容性的影响。最后提供了确保下载过程稳定可靠的实用建议,帮助用户避免非官方渠道的风险。

热心网友
05.11
OKX欧易交易所开户注册教程:从实名认证到安全设置完整指南
web3.0
OKX欧易交易所开户注册教程:从实名认证到安全设置完整指南

本文详细介绍了在欧亿平台完成开户注册的全过程,涵盖账户创建、实名认证、安全设置及首次登录等关键步骤。重点阐述了实名认证的必要性与操作流程,并强调了绑定双重验证、资金密码等安全措施的重要性,旨在为用户提供一个清晰、安全的入门指引,帮助其顺利开启数字资产交易之旅。

热心网友
05.11
欧意OKX安全设置全攻略:新手入场前必学的资产保护指南
web3.0
欧意OKX安全设置全攻略:新手入场前必学的资产保护指南

本文针对欧意OKX新用户,强调安全设置是入场前首要任务。详细介绍了如何开启双重验证、管理API密钥、设置提现白名单及识别官方渠道等核心安全功能。通过分步讲解与实用建议,帮助用户建立基础安全屏障,理解平台安全逻辑,从而更安心地探索Web3世界。

热心网友
05.11