首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
Hy3大模型为何在OpenRouter排行榜上遥遥领先

Hy3大模型为何在OpenRouter排行榜上遥遥领先

热心网友
26
转载
2026-05-27

最近大模型发布节奏快得让人眼花缭乱,这时候,一个能通过统一API调用多数主流模型的平台就显得格外有用。OpenRouter正是这样的服务商。作为用户与各大模型API之间的桥梁,它积累了海量、极具代表性的用户使用数据。难得的是,OpenRouter选择将这些数据公之于众,在其“AI模型排行榜”页面上实时更新——这与各大模型实验室通常将此类数据视为竞争机密而秘而不宣的做法,形成了鲜明对比。最近浏览这个排行榜时,一个奇怪的现象引起了我的注意。

数据获取于2026年5月25日。

两个新模型在令牌使用量上,竟然超过了曾经的宠儿Claude,而且领先幅度超过50%?DeepSeek Flash V4我有所耳闻,这是深度求索公司的开源模型,不仅速度快、价格低,性能也接近头部模型,性价比极高,它的流行并不意外。但“Hy3 preview”又是什么来头?此前从未听说过Hy3,也没见任何人讨论过它。简单搜索后发现,这是中国巨头腾讯发布的一款开源模型。然而,它在Hugging Face上的模型页面信息寥寥,甚至包含了一些对其不利的、略显“实诚”的基准测试结果,显示其表现逊于其他中国开源模型。

来自腾讯Hugging Face仓库的Hy3代码能力基准测试结果。

在Hacker News上搜索Hy3,只找到一条不相关的提交;Reddit上的讨论也更多集中在“开源权重”本身。倒是有一条5月6日的Reddit帖子提到了Hy3的崛起,但当时OpenRouter提供的是免费端点。如今免费通道已关闭,这意味着当前排行榜上Hy3的使用量,全部来自付费用户。

看起来,Hy3 preview的流行并不仅限于智能体编码领域。

数据获取于2026年5月25日。

难道我错过了什么重要信息?经过一些非严格的测试,这个模型的质量确实如基准测试所示,与提及的其他中国模型处于同一梯队,与Claude Opus 4.7或GPT 5.5等模型尚有差距。它并非一颗被埋没的“魔法钻石”,那么其流行背后必然另有原因。好在OpenRouter的数据或许能帮助我们缩小解释的范围,但仔细查看数据后,疑惑反而更深了。

在OpenRouter API上,Hy3 preview的标称输入价格为每百万令牌0.066美元,这确实比当前排名第一的DeepSeek V4 Flash(标价0.10美元/百万令牌)更便宜。考虑到LLM和编码智能体成本急剧上升,一个更便宜的模型如果质量相近,自然会胜出——但问题恰恰在于,Hy3 preview的质量似乎并未达到同等水平。

这是OpenRouter模型页面上显示的Hy3 preview使用量随时间变化的图表:

图表显示,Hy3 preview在5月8日之前没有任何使用数据,这很可能就是该模型从免费SKU切换到付费SKU的时间点。自那以后,使用量保持稳定,而本文引用的初始排名数据是在切换几周后统计的,这表明其使用量至少是有机增长(或者伪造成本极高),而非一次性异常值。值得注意的是,如果计算一下图中数据,会发现LLM API调用的输入令牌与输出令牌比例,在聚合层面上达到了惊人的98%比2%

回顾OpenRouter AI模型排行榜的历史,特定应用突然切换默认模型曾导致使用量飙升,例如2025年9月Kilo Code免费提供Grok Code Fast 1时。但这种情况似乎不适用于Hy3,因为应用仅占其活动量的极小部分。

排名前五的应用贡献了Hy3 preview总活动量的不到1%。

OpenRouter的核心价值之一是能够自动将API请求路由到不同的供应商。对于DeepSeek V4 Flash这类开源模型,OpenRouter列出了13个供应商,但同为开源权重的Hy3 preview却只有一个供应商1——总部位于新加坡的SiliconFlow。OpenRouter上SiliconFlow的使用量页面显示,在Hy3出现之前,其使用量一直很低。

绿色区域对应免费Hy3使用量,蓝色区域对应付费Hy3使用量:OpenRouter在鼠标悬停时未作区分,这疑似一个显示Bug。

巧合的是,该数据可视化显示,当Hy3 preview从免费转为付费时,使用量并未急剧下降,这本身就是一个有趣的现象:如果用户无法从免费模型中获取价值,一旦开始收费,他们很可能会停止使用。

我到底遗漏了什么?是不是我想多了,答案其实很简单,就是“因为它最便宜”,并且从免费期获得了足够的“亏本引流”效应?

……但Hy3 preview真的是OpenRouter上由大公司支持的最便宜的LLM吗?为了核实一些假设,我发现OpenRouter的数据显示,事实并非如此:性能良好的LLM中最便宜的其实是DeepSeek V4 Flash,只不过这里有些有趣的细节。

2026年的LLM经济学

这里需要先补充几个关于LLM API工作原理、却不常被讨论的要点。LLM调用目前仍然是无状态的,这意味着每一轮对话(包括用户向LLM提问的消息)后,当前会话线程中的所有令牌都会被重新处理。对于智能体应用来说,输入令牌的数量会随着每条后续消息累积增加,这也是为什么当上下文填满时,频繁开启新会话线程被鼓励用于高效智能体使用的原因之一。

使用DeepSeek V4 Flash的Zed Agent在一分钟内的OpenRouter日志(反向时序)。

其实,早在智能体工作流出现之前,处理大型输入(如完整PDF)就已经会类似地膨胀上下文。因此,大多数LLM提供商实施了提示词缓存技术,复用对话中较早处理的输入令牌。这是一个双赢策略:既为LLM提供商节省了时间与算力,也将节省的成本传递给了客户。大多数LLM提供商会自动缓存输入,包括通过OpenRouter访问时也是如此:成本旁边的磁盘闪电符号就表示令牌已被缓存。当然,缓存并非总能命中,特别是在OpenRouter在线程中途切换供应商时。 Anthropic(Claude)API是个特例,它需要先付费购买缓存写入权限。

通常,缓存读取成本是输入成本的10%。OpenAI API、Anthropic API和Google Gemini API的最新模型都是如此。对于提供DeepSeek V4 Flash的13家供应商,缓存读取成本在输入成本的20%到50%之间,这可以理解,因为它们可能不具备同等的规模经济效应。然而,有一家DeepSeek V4 Flash供应商例外:

缓存读取成本只有2%!(乘以2,小数点左移两位)DeepSeek的缓存读取价格为何如此之低?从V4开始,DeepSeek采用了一种新的KV缓存方法。作为模型的创造者,它最有条件充分利用自身的技术创新,正如前文所说,这种好处最终惠及了客户。当由DeepSeek自身提供服务时,其DeepSeek V4 Pro变体模型的缓存读取成本更是低至0.83%!(这个数字最好用计算器验证一下)

还记得前面提到,现在LLM API成本的98%都来自输入令牌,而这些输入令牌又被积极地缓存吗?这意味着LLM的“标称”价格现在具有误导性,不过这种误导对客户有利,因为实际有效价格会便宜得多!为了消除这种模糊性,OpenRouter现在在模型页面上提供了一个有效价格表,其中考虑了缓存命中带来的成本节省。以下是DeepSeek V4 Flash通过OpenRouter各供应商的有效定价(因缓存读取成本和命中率不同而各异):

数据获取于2026年5月25日;这些值每小时更新。

价格参差不齐,但请注意第二行,由DeepSeek自身作为供应商时,其输入价格高达每百万令牌0.018美元!那2%的缓存读取成本确实带来了巨大优势。与Hy3 preview进行同类比较,其模型页面显示,来自SiliconFlow(缓存读取成本高达44%)的有效价格为每百万令牌0.034美元,几乎是DeepSeek自身提供的DeepSeek V4 Flash价格的两倍!当然,这仅适用于明确使用DeepSeek作为供应商的情况,而一些下游的OpenRouter客户端/智能体可能不支持此选项。不过,OpenRouter上的价格与直接从DeepSeek获取的价格一致,因此使用直接的DeepSeek API密钥效果相同。

此外,房间里还有一头“大象”:DeepSeek是一家中国公司,部分用户可能不愿意——或者法律上不允许——将他们的支付处理信息或LLM输入数据提供给一家在其OpenRouter数据政策信息中将提示词训练设为true的中国公司,这是一个合理的顾虑。

诚然,如果你能持续用尽使用限额,像Claude Code和Codex这类订阅制LLM服务仍然是性价比最高的选择。但通过API使用超级便宜的DeepSeek V4 Flash,不会将你锁定在订阅制中。如果你需要额外的智能体算力来完成一个项目,它比订阅服务支付超额费用更划算。2 至少,在2026年袋里式AI竞争白热化之际,它构成了对潜在额外定价策略的一种微观经济制衡。

总的来说,我仍然无法完全理解Hy3 preview在OpenRouter上流行的原因。根据现有的数据和分析,我的猜测是,可能有一个与腾讯无关的大型独立应用,将Hy3用作其数据处理后端,而且这个应用并非纯粹的智能体编码应用。不过,OpenRouter的优势之一就是切换模型和供应商的成本极低。因此,一旦人们意识到DeepSeek V4 Flash的定价优势,它在几周内使用量激增,我也不会感到意外。

  1. Hy3的许可证限制非常严格,这可能会阻碍其他供应商采用该模型。↩︎

  2. DeepSeek刚刚也宣布了其基于V4 Flash的编码智能体平台,声称利用了其强大的缓存技术,但其输入成本为50%,缓存读取成本则显著更高,为20%,因此尚不清楚其经济性是否真的比使用DeepSeek API密钥搭配其他智能体更优。↩︎

来源:https://www.bestblogs.dev/article/f06308da?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Hy3大模型为何在OpenRouter排行榜上遥遥领先
AI资讯
Hy3大模型为何在OpenRouter排行榜上遥遥领先

OpenRouter平台公开数据显示,腾讯开源模型Hy3preview在付费后使用量稳定增长,但其性能基准与同类中国模型相近。DeepSeekV4Flash因创新的缓存技术,实际有效价格显著低于标价,性价比突出。Hy3的流行原因尚不明确,可能源于特定大型应用的后端采用。模型切换成本低,未来使用格局可能因价格优势而快速变化。

热心网友
05.27
AI基础设施独角兽崛起 Fireworks与Baseten领跑行业新趋势
AI资讯
AI基础设施独角兽崛起 Fireworks与Baseten领跑行业新趋势

如果说四月份我们聊到“推理拐点”时还只是趋势初显,那么过去一周的新闻则像是一记响亮的确认信号。市场用真金白银投票,告诉我们一个明确的结论:AI基础设施,尤其是推理和模型路由层,正从“值得关注”变为“必须押注”的核心赛道。 [AINews] 新晋AI基础设施独角兽:Exa, Modal, TurboP

热心网友
05.27
OpenRouter月处理百亿Token AI中转服务盈利模式解析
AI资讯
OpenRouter月处理百亿Token AI中转服务盈利模式解析

OpenRouter完成1 13亿美元B轮融资,估值达13亿美元,一年内翻倍。其作为AI模型聚合平台,每周处理约25万亿tokens,连接超400个模型,为企业提供统一API、智能路由与成本管理。投资方包括谷歌旗下CapitalG和英伟达等,反映出行业对多模型调度层战略价值的共识。平台实时排行榜已成为观察AI趋势的重要风向标。

热心网友
05.27
OpenRouter月处理100万亿Token AI中转服务盈利惊人
AI资讯
OpenRouter月处理100万亿Token AI中转服务盈利惊人

每周处理高达25万亿个tokens的真实流量,估值在短短一年内实现翻倍——AI模型聚合平台OpenRouter近日成功完成1 13亿美元的B轮融资。这背后揭示的,远不止是简单的“中间商”逻辑,而是一个正在重塑企业AI应用范式的关键基础设施。 日前,这家备受瞩目的平台正式宣布了本轮融资消息。领投方为谷

热心网友
05.27
OpenRouter完成B轮融资获1.13亿美元 估值达13亿美元
AI资讯
OpenRouter完成B轮融资获1.13亿美元 估值达13亿美元

近日,领先的AI网关与模型聚合平台OpenRouter宣布完成1 13亿美元B轮融资,本轮融资由谷歌母公司Alphabet旗下的成长型风险投资基金CapitalG领投。据《纽约时报》报道,此轮融资后,OpenRouter的估值已跃升至约13亿美元,正式跻身独角兽行列。 这家成立于2023年的创新企业

热心网友
05.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

如何选择PPT软件:提升演示效果的关键指南
AI教程
如何选择PPT软件:提升演示效果的关键指南

制作PPT用什么软件好?2024年五大主流工具深度评测 无论是职场汇报、学术答辩还是项目路演,一份专业且吸引人的PPT演示文稿都至关重要。面对众多制作工具,如何选择最适合自己的那一款?本文将对五款主流的PPT软件进行全方位对比分析,从功能、协作、设计到易用性,助您根据核心需求做出最佳决策,高效打造令

热心网友
05.27
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨
AI资讯
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨

今日A股市场整体走势偏弱,朗玛信息(股票代码300288)股价同步调整,截至收盘下跌3 16%,全天成交额4783 73万元,换手率为1 77%,公司总市值约为35 21亿元。股价的短期波动,引发了投资者对其核心投资逻辑与未来潜在机会的深入探讨。 异动深度解析:AI医疗战略的机遇与挑战 朗玛信息是市

热心网友
05.27
超级蠕虫大战圣诞老人2攻略 游戏玩法技巧全解析
游戏攻略
超级蠕虫大战圣诞老人2攻略 游戏玩法技巧全解析

《超级蠕虫大战圣诞老人2》是一款休闲益智游戏,攻略涵盖基本操作、关卡解锁与道具使用。玩家需掌握战斗策略与技能升级,熟悉敌人特性和环境机制。合理运用道具并完成隐藏任务可获取奖励,多人模式注重策略博弈。建议多练习并参与社区交流,同时注意游戏时长以保护视力。

热心网友
05.27
Kimi联网搜索排除干扰技巧 精准限定提示词方法
AI资讯
Kimi联网搜索排除干扰技巧 精准限定提示词方法

在Kimi里搜索“2026年北京积分落户政策细则”,如果跳出来的总是房产中介的软文、培训机构的广告或者各种自媒体猜测,那说明默认的联网检索没有经过过滤。想要获得干净、权威的结果,必须主动使用结构化的提示词进行限定。 用结构化提示词锁定权威信源 这一步是关键,直接决定了你看到的信息是来自官方发布渠道,

热心网友
05.27
Qoder编辑器自动保存功能设置与基础配置教程
AI资讯
Qoder编辑器自动保存功能设置与基础配置教程

为避免代码丢失,Qoder编辑器需手动开启自动保存功能。全局设置中可开启开关并选择触发条件,如按时间间隔或窗口失去焦点时保存。还可为特定项目单独配置,覆盖全局设置。若功能失效,需检查文件位置是否只读、用户权限是否足够,并避免直接编辑受保护的系统文件。

热心网友
05.27