阿里云百炼Qwen3.7-Plus模型价格最高享5折附免费Token领取

时间：2026-07-02 12:12

阿里云百炼Qwen3 7-Plus模型输入原价2元百万tokens，限时8折，输出原价8元百万tokens同享折扣，新用户可领100万免费Tokens。该模型为中高性价比旗舰级，支持文本、图片、视频输入及文本输出，具备多模态交互与智能体能力。

阿里云百炼平台的Qwen3.7-Plus模型，近期在定价方面进行了一轮显著的降价调整。首先汇总几个关键信息：输入价格原为每百万tokens 2元，目前可享限时8折优惠；输出价格原为每百万tokens 8元，同样可以享受这一折扣。更值得一提的是，新用户还能在平台免费领取高达100万Tokens的体验额度，对于想要初步尝试该模型的用户而言，这无疑是一张零成本的入场券。

百炼Qwen3.7-Plus模型定价方案

从市场定位来看，Qwen3.7-Plus的定位非常明确——一款兼具中高性价比的旗舰级大型语言模型。它不仅延续了强大的文本处理能力，更将视觉-语言理解能力提升到了新高度。在编码辅助、工具调用、生产力工作流等应用场景中，它也能实现全面覆盖。简而言之，Qwen3.7-Plus具备多模态交互混合智能体能力，可以感知真实世界场景、读取屏幕并操作图形用户界面（GUI）、基于视觉参考生成代码，甚至能够端到端地导航移动应用。

在输入模态方面，它支持文本、图片和视频，而输出则采用文本形式。支持的功能包括模型体验、函数调用（function calling）、结构化输出、联网搜索、前缀续写、缓存（cache）以及批量推理——几乎涵盖了日常开发和生产环境中所需的各项实用能力。

模型定价（输入<=256k）

我们先来看输入长度不超过256k的情况。此区间的定价逻辑十分清晰，各类计费项均有对应的折扣策略。

计费项目	优惠折扣	原价（元/百万tokens）	折后单价
输入	限时8折	2元/每百万tokens	1.6元/每百万tokens
输入（缓存命中）	限时8折	0.4元/每百万tokens	0.32元/每百万tokens
输入（Batch File）	-	1元/每百万tokens	1元/每百万tokens
显式缓存创建	限时8折	2.5元/每百万tokens	2元/每百万tokens
显式缓存命中	限时8折	0.2元/每百万tokens	0.16元/每百万tokens
输入（Batch Chat）	限时5折	2元/每百万tokens	1元/每百万tokens
输出	限时8折	8元/每百万tokens	6.4元/每百万tokens
输出（Batch File）	-	4元/每百万tokens	4元/每百万tokens
输出（Batch Chat）	限时5折	8元/每百万tokens	4元/每百万tokens

模型定价（256k<输入<=1m）

如果输入长度超过256k，但在1m以内，整体价格体系会相应上调一档。不过，相应的限时折扣力度依然存在，这些优惠活动值得重点关注。

计费类型	优惠活动	原价(元/每百万tokens)	折后价(元/每百万tokens)
输入	限时8折	6	4.8
输入（缓存命中）	限时8折	1.2	0.96
输入（Batch File）	无	3	3
显式缓存创建	限时8折	7.5	6
显式缓存命中	限时8折	0.6	0.48
输入（Batch Chat）	限时5折	6	3
输出	限时8折	24	19.2
输出（Batch File）	无	12	12
输出（Batch Chat）	限时5折	24	12

工具调用费用

在工具调用方面，费用按千次调用计算，部分工具目前仍处于免费试用阶段。

工具名称	计费单价（元/千次调用）
code_interpreter（Responses API）	限时免费
i2i_search（Responses API）	48
t2i_search（Responses API）	24
web_extractor（Responses API）	限时免费
web_search（Responses API）	4

免费额度

平台为新用户提供了一项非常直接的福利——100万Tokens的免费额度。开通百炼服务后，即可直接领取，操作门槛相当低。

模型限流与上下文参数

最后，我们来关注一下关键的技术参数。Qwen3.7-Plus的上下文窗口长度达到了1M，最大输入长度为991K，最大输出长度为64K。在思考模式下，输入和输出的最大长度会略有微调，但整体仍维持在同一个量级。此外，思考模式下的最大思维链长度扩展到了256K。在限流方面，RPM（每分钟请求数）高达30000，TPM（每分钟Token处理数）则为50000000，对于绝大多数应用场景而言，这样的性能绰绰有余。

参数项	参数值
最大输入长度	991K
最大输出长度	64K
RPM	30000
TPM	50000000
最大输入长度(思考模式下)	983K
最大输出长度(思考模式下)	64K
上下文长度	1M
最大思维链长度	256K

来源：https://developer.aliyun.com/article/1744767

Plus

上一篇Claude电脑操控功能上线，AI从聊天到动手，OpenClaw还能卷多久 下一篇阿里云Token Plan 2026 Credits计费详解与套餐价格核心问答

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-02

内网RPA离线部署从依赖打包到7×24无人值守踩坑与避坑方案

这三年，内网RPA项目接了不下二十个。每次开局都像闯关——断网、缺依赖、多机同步、定时执行、批量分发、源码保护、AI离线化，八个坑一个比一个深。今天把这些实战经验整理出来，希望能帮正在内网搞自动化的兄弟们少踩点雷。一、内网无网络环境怎么部署RPA流程：先搞清楚什么叫“真离线” 很多工具宣传“支持本

AI教程 · 2026-07-02

水利工程师用WorkBuddy写洪水报告效率提升3倍

WorkBuddy开发者分享季水利工程师AI提效实战：用WorkBuddy撰写洪水影响评价报告，效率提升3倍 WorkBuddy 效率人工智能开发工具一、我是谁，为什么需要AI 先介绍一下自己——我是一名水利工程师，在湖南长沙的一家小型水利设计公司任职。当前行业环境不太

AI教程 · 2026-07-02

日志服务数据加工规则洞察仪表盘使用指南

数据加工诊断仪表盘想实时掌握日志服务加工功能的运行状态？直接从加工列表页点击那个“规则洞察”按钮，仪表盘就会立刻呈现出来。入口就在那儿，不绕弯子。跳转后，你可以按作业名称、实例ID或源LogStore来筛选任务状态。比如下边这张图，展示的是当前实例ID（90c9d47714dbb807d47c1

AI教程 · 2026-07-02

基于RFID的固定资产管理系统技术架构与工程实践

固定资产管理难题是众多企事业单位的普遍困扰，资产数量动辄数千件，且广泛分布于不同部门、楼层乃至园区。传统人工盘点方式在工程维度上始终面临三大关键瓶颈：采集效率低下、数据闭环中断、状态同步滞后。使用条码枪逐一扫描标签，识别距离通常不超过30厘米，操作人员需逐个寻找并扫描，盘点效率完全受限于人力。面对5

AI教程 · 2026-07-02

WorkBuddy实战用AI搭建A股智能盯盘助手省心高效

炒股的朋友们想必都深有体会——每天重复盯盘、查行情、分析板块轮动，这一整套流程下来耗费大量精力。手动翻查数据不仅身心俱疲，还很容易错过关键买卖节点。今天我们就来聊聊如何打造一款趁手的盯盘工具，借助AI替你分担这些重复性工作。背景：盯盘的核心痛点股民都有同感——每天不只要查询单只股票的实时行情，还