Hy3大模型为何在OpenRouter排行榜上遥遥领先

首页

AI资讯

热心网友

转载

2026-05-27

最近大模型发布节奏快得让人眼花缭乱，这时候，一个能通过统一API调用多数主流模型的平台就显得格外有用。OpenRouter正是这样的服务商。作为用户与各大模型API之间的桥梁，它积累了海量、极具代表性的用户使用数据。难得的是，OpenRouter选择将这些数据公之于众，在其“AI模型排行榜”页面上实时更新——这与各大模型实验室通常将此类数据视为竞争机密而秘而不宣的做法，形成了鲜明对比。最近浏览这个排行榜时，一个奇怪的现象引起了我的注意。

数据获取于2026年5月25日。

两个新模型在令牌使用量上，竟然超过了曾经的宠儿Claude，而且领先幅度超过50%？DeepSeek Flash V4我有所耳闻，这是深度求索公司的开源模型，不仅速度快、价格低，性能也接近头部模型，性价比极高，它的流行并不意外。但“Hy3 preview”又是什么来头？此前从未听说过Hy3，也没见任何人讨论过它。简单搜索后发现，这是中国巨头腾讯发布的一款开源模型。然而，它在Hugging Face上的模型页面信息寥寥，甚至包含了一些对其不利的、略显“实诚”的基准测试结果，显示其表现逊于其他中国开源模型。

来自腾讯Hugging Face仓库的Hy3代码能力基准测试结果。

在Hacker News上搜索Hy3，只找到一条不相关的提交；Reddit上的讨论也更多集中在“开源权重”本身。倒是有一条5月6日的Reddit帖子提到了Hy3的崛起，但当时OpenRouter提供的是免费端点。如今免费通道已关闭，这意味着当前排行榜上Hy3的使用量，全部来自付费用户。

看起来，Hy3 preview的流行并不仅限于智能体编码领域。

数据获取于2026年5月25日。

难道我错过了什么重要信息？经过一些非严格的测试，这个模型的质量确实如基准测试所示，与提及的其他中国模型处于同一梯队，与Claude Opus 4.7或GPT 5.5等模型尚有差距。它并非一颗被埋没的“魔法钻石”，那么其流行背后必然另有原因。好在OpenRouter的数据或许能帮助我们缩小解释的范围，但仔细查看数据后，疑惑反而更深了。

在OpenRouter API上，Hy3 preview的标称输入价格为每百万令牌0.066美元，这确实比当前排名第一的DeepSeek V4 Flash（标价0.10美元/百万令牌）更便宜。考虑到LLM和编码智能体成本急剧上升，一个更便宜的模型如果质量相近，自然会胜出——但问题恰恰在于，Hy3 preview的质量似乎并未达到同等水平。

这是OpenRouter模型页面上显示的Hy3 preview使用量随时间变化的图表：

图表显示，Hy3 preview在5月8日之前没有任何使用数据，这很可能就是该模型从免费SKU切换到付费SKU的时间点。自那以后，使用量保持稳定，而本文引用的初始排名数据是在切换几周后统计的，这表明其使用量至少是有机增长（或者伪造成本极高），而非一次性异常值。值得注意的是，如果计算一下图中数据，会发现LLM API调用的输入令牌与输出令牌比例，在聚合层面上达到了惊人的98%比2%。

回顾OpenRouter AI模型排行榜的历史，特定应用突然切换默认模型曾导致使用量飙升，例如2025年9月Kilo Code免费提供Grok Code Fast 1时。但这种情况似乎不适用于Hy3，因为应用仅占其活动量的极小部分。

排名前五的应用贡献了Hy3 preview总活动量的不到1%。

OpenRouter的核心价值之一是能够自动将API请求路由到不同的供应商。对于DeepSeek V4 Flash这类开源模型，OpenRouter列出了13个供应商，但同为开源权重的Hy3 preview却只有一个供应商¹——总部位于新加坡的SiliconFlow。OpenRouter上SiliconFlow的使用量页面显示，在Hy3出现之前，其使用量一直很低。

绿色区域对应免费Hy3使用量，蓝色区域对应付费Hy3使用量：OpenRouter在鼠标悬停时未作区分，这疑似一个显示Bug。

巧合的是，该数据可视化显示，当Hy3 preview从免费转为付费时，使用量并未急剧下降，这本身就是一个有趣的现象：如果用户无法从免费模型中获取价值，一旦开始收费，他们很可能会停止使用。

我到底遗漏了什么？是不是我想多了，答案其实很简单，就是“因为它最便宜”，并且从免费期获得了足够的“亏本引流”效应？

……但Hy3 preview真的是OpenRouter上由大公司支持的最便宜的LLM吗？为了核实一些假设，我发现OpenRouter的数据显示，事实并非如此：性能良好的LLM中最便宜的其实是DeepSeek V4 Flash，只不过这里有些有趣的细节。

2026年的LLM经济学

这里需要先补充几个关于LLM API工作原理、却不常被讨论的要点。LLM调用目前仍然是无状态的，这意味着每一轮对话（包括用户向LLM提问的消息）后，当前会话线程中的所有令牌都会被重新处理。对于智能体应用来说，输入令牌的数量会随着每条后续消息累积增加，这也是为什么当上下文填满时，频繁开启新会话线程被鼓励用于高效智能体使用的原因之一。

使用DeepSeek V4 Flash的Zed Agent在一分钟内的OpenRouter日志（反向时序）。

其实，早在智能体工作流出现之前，处理大型输入（如完整PDF）就已经会类似地膨胀上下文。因此，大多数LLM提供商实施了提示词缓存技术，复用对话中较早处理的输入令牌。这是一个双赢策略：既为LLM提供商节省了时间与算力，也将节省的成本传递给了客户。大多数LLM提供商会自动缓存输入，包括通过OpenRouter访问时也是如此：成本旁边的磁盘闪电符号就表示令牌已被缓存。当然，缓存并非总能命中，特别是在OpenRouter在线程中途切换供应商时。 Anthropic（Claude）API是个特例，它需要先付费购买缓存写入权限。

通常，缓存读取成本是输入成本的10%。OpenAI API、Anthropic API和Google Gemini API的最新模型都是如此。对于提供DeepSeek V4 Flash的13家供应商，缓存读取成本在输入成本的20%到50%之间，这可以理解，因为它们可能不具备同等的规模经济效应。然而，有一家DeepSeek V4 Flash供应商例外：

缓存读取成本只有2%！（乘以2，小数点左移两位）DeepSeek的缓存读取价格为何如此之低？从V4开始，DeepSeek采用了一种新的KV缓存方法。作为模型的创造者，它最有条件充分利用自身的技术创新，正如前文所说，这种好处最终惠及了客户。当由DeepSeek自身提供服务时，其DeepSeek V4 Pro变体模型的缓存读取成本更是低至0.83%！（这个数字最好用计算器验证一下）

还记得前面提到，现在LLM API成本的98%都来自输入令牌，而这些输入令牌又被积极地缓存吗？这意味着LLM的“标称”价格现在具有误导性，不过这种误导对客户有利，因为实际有效价格会便宜得多！为了消除这种模糊性，OpenRouter现在在模型页面上提供了一个有效价格表，其中考虑了缓存命中带来的成本节省。以下是DeepSeek V4 Flash通过OpenRouter各供应商的有效定价（因缓存读取成本和命中率不同而各异）：

数据获取于2026年5月25日；这些值每小时更新。

价格参差不齐，但请注意第二行，由DeepSeek自身作为供应商时，其输入价格高达每百万令牌0.018美元！那2%的缓存读取成本确实带来了巨大优势。与Hy3 preview进行同类比较，其模型页面显示，来自SiliconFlow（缓存读取成本高达44%）的有效价格为每百万令牌0.034美元，几乎是DeepSeek自身提供的DeepSeek V4 Flash价格的两倍！当然，这仅适用于明确使用DeepSeek作为供应商的情况，而一些下游的OpenRouter客户端/智能体可能不支持此选项。不过，OpenRouter上的价格与直接从DeepSeek获取的价格一致，因此使用直接的DeepSeek API密钥效果相同。

此外，房间里还有一头“大象”：DeepSeek是一家中国公司，部分用户可能不愿意——或者法律上不允许——将他们的支付处理信息或LLM输入数据提供给一家在其OpenRouter数据政策信息中将提示词训练设为true的中国公司，这是一个合理的顾虑。

诚然，如果你能持续用尽使用限额，像Claude Code和Codex这类订阅制LLM服务仍然是性价比最高的选择。但通过API使用超级便宜的DeepSeek V4 Flash，不会将你锁定在订阅制中。如果你需要额外的智能体算力来完成一个项目，它比订阅服务支付超额费用更划算。² 至少，在2026年袋里式AI竞争白热化之际，它构成了对潜在额外定价策略的一种微观经济制衡。

总的来说，我仍然无法完全理解Hy3 preview在OpenRouter上流行的原因。根据现有的数据和分析，我的猜测是，可能有一个与腾讯无关的大型独立应用，将Hy3用作其数据处理后端，而且这个应用并非纯粹的智能体编码应用。不过，OpenRouter的优势之一就是切换模型和供应商的成本极低。因此，一旦人们意识到DeepSeek V4 Flash的定价优势，它在几周内使用量激增，我也不会感到意外。

Hy3的许可证限制非常严格，这可能会阻碍其他供应商采用该模型。↩︎
DeepSeek刚刚也宣布了其基于V4 Flash的编码智能体平台，声称利用了其强大的缓存技术，但其输入成本为50%，缓存读取成本则显著更高，为20%，因此尚不清楚其经济性是否真的比使用DeepSeek API密钥搭配其他智能体更优。↩︎

来源:https://www.bestblogs.dev/article/f06308da?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：面向Altera FPGA与SoC的边缘AI开发工具套件下一篇：可灵AI制作平行蒙太奇教程：异地同步动作剪辑技巧