阿里云百炼平台的Qwen3.7-Plus模型,近期在定价方面进行了一轮显著的降价调整。首先汇总几个关键信息:输入价格原为每百万tokens 2元,目前可享限时8折优惠;输出价格原为每百万tokens 8元,同样可以享受这一折扣。更值得一提的是,新用户还能在平台免费领取高达100万Tokens的体验额度,对于想要初步尝试该模型的用户而言,这无疑是一张零成本的入场券。

百炼Qwen3.7-Plus模型定价方案
从市场定位来看,Qwen3.7-Plus的定位非常明确——一款兼具中高性价比的旗舰级大型语言模型。它不仅延续了强大的文本处理能力,更将视觉-语言理解能力提升到了新高度。在编码辅助、工具调用、生产力工作流等应用场景中,它也能实现全面覆盖。简而言之,Qwen3.7-Plus具备多模态交互混合智能体能力,可以感知真实世界场景、读取屏幕并操作图形用户界面(GUI)、基于视觉参考生成代码,甚至能够端到端地导航移动应用。

在输入模态方面,它支持文本、图片和视频,而输出则采用文本形式。支持的功能包括模型体验、函数调用(function calling)、结构化输出、联网搜索、前缀续写、缓存(cache)以及批量推理——几乎涵盖了日常开发和生产环境中所需的各项实用能力。
模型定价(输入<=256k)
我们先来看输入长度不超过256k的情况。此区间的定价逻辑十分清晰,各类计费项均有对应的折扣策略。
| 计费项目 | 优惠折扣 | 原价(元/百万tokens) | 折后单价 |
| 输入 | 限时8折 | 2元/每百万tokens | 1.6元/每百万tokens |
| 输入(缓存命中) | 限时8折 | 0.4元/每百万tokens | 0.32元/每百万tokens |
| 输入(Batch File) | - | 1元/每百万tokens | 1元/每百万tokens |
| 显式缓存创建 | 限时8折 | 2.5元/每百万tokens | 2元/每百万tokens |
| 显式缓存命中 | 限时8折 | 0.2元/每百万tokens | 0.16元/每百万tokens |
| 输入(Batch Chat) | 限时5折 | 2元/每百万tokens | 1元/每百万tokens |
| 输出 | 限时8折 | 8元/每百万tokens | 6.4元/每百万tokens |
| 输出(Batch File) | - | 4元/每百万tokens | 4元/每百万tokens |
| 输出(Batch Chat) | 限时5折 | 8元/每百万tokens | 4元/每百万tokens |
模型定价(256k<输入<=1m)
如果输入长度超过256k,但在1m以内,整体价格体系会相应上调一档。不过,相应的限时折扣力度依然存在,这些优惠活动值得重点关注。
| 计费类型 | 优惠活动 | 原价(元/每百万tokens) | 折后价(元/每百万tokens) |
| 输入 | 限时8折 | 6 | 4.8 |
| 输入(缓存命中) | 限时8折 | 1.2 | 0.96 |
| 输入(Batch File) | 无 | 3 | 3 |
| 显式缓存创建 | 限时8折 | 7.5 | 6 |
| 显式缓存命中 | 限时8折 | 0.6 | 0.48 |
| 输入(Batch Chat) | 限时5折 | 6 | 3 |
| 输出 | 限时8折 | 24 | 19.2 |
| 输出(Batch File) | 无 | 12 | 12 |
| 输出(Batch Chat) | 限时5折 | 24 | 12 |
工具调用费用
在工具调用方面,费用按千次调用计算,部分工具目前仍处于免费试用阶段。
| 工具名称 | 计费单价(元/千次调用) |
| code_interpreter(Responses API) | 限时免费 |
| i2i_search(Responses API) | 48 |
| t2i_search(Responses API) | 24 |
| web_extractor(Responses API) | 限时免费 |
| web_search(Responses API) | 4 |
免费额度
平台为新用户提供了一项非常直接的福利——100万Tokens的免费额度。开通百炼服务后,即可直接领取,操作门槛相当低。

模型限流与上下文参数
最后,我们来关注一下关键的技术参数。Qwen3.7-Plus的上下文窗口长度达到了1M,最大输入长度为991K,最大输出长度为64K。在思考模式下,输入和输出的最大长度会略有微调,但整体仍维持在同一个量级。此外,思考模式下的最大思维链长度扩展到了256K。在限流方面,RPM(每分钟请求数)高达30000,TPM(每分钟Token处理数)则为50000000,对于绝大多数应用场景而言,这样的性能绰绰有余。
| 参数项 | 参数值 |
| 最大输入长度 | 991K |
| 最大输出长度 | 64K |
| RPM | 30000 |
| TPM | 50000000 |
| 最大输入长度(思考模式下) | 983K |
| 最大输出长度(思考模式下) | 64K |
| 上下文长度 | 1M |
| 最大思维链长度 | 256K |
