QwQ-32B推理模型开源，更小尺寸更强性能_AI热点日报

QwQ-32B推理模型开源，更小尺寸更强性能

类型：热点整理2026-07-02

阿里云近日发布重磅消息——正式开源了新一代推理模型QwQ-32B。这个名称虽然有些拗口，但其性能却毫不含糊。用一句话概括：表现强劲、部署门槛低廉、商用完全免费，将开源推理模型的“性价比天花板”再次提升了一个台阶。先来锁定几个核心判断：该模型在数学、编程以及通用能力方面的表现，几乎与DeepSee

阿里云近日发布重磅消息——正式开源了新一代推理模型QwQ-32B。这个名称虽然有些拗口，但其性能却毫不含糊。用一句话概括：表现强劲、部署门槛低廉、商用完全免费，将开源推理模型的“性价比天花板”再次提升了一个台阶。

先来锁定几个核心判断：

该模型在数学、编程以及通用能力方面的表现，几乎与DeepSeek-R1并驾齐驱，而它的参数量仅为32B。更关键的是，它能够在消费级显卡上实现本地部署——这意味着，你不需要昂贵的云端设备，仅凭自己的机器就能运行出接近顶尖水平的推理结果。

阿里云此次采用了极为开放的Apache2.0协议，任何人都可以免费下载、商用，甚至进行二次开发与部署。具体细节如下。

性能对标全球最强开源推理模型

QwQ-32B是通义团队在推理模型方向的最新研究成果。这次的训练策略颇具巧思：在冷启动的基础上，分别针对数学与编程任务、通用能力进行了两轮大规模强化学习。最终结果是，在32B这一相对“轻量”的模型尺寸上，推理能力实现了质的飞跃，再次印证了大规模强化学习这条路径的可行性。

在一系列权威基准测试中，QwQ-32B的表现几乎全面超越OpenAI-o1-mini，整体水平与DeepSeek-R1相当。具体来看：

在数学能力评测集AIME24以及代码能力评估LiveCodeBench上，QwQ-32B与DeepSeek-R1不相上下，显著优于o1-mini以及同尺寸的R1蒸馏模型；在Meta首席科学家杨立昆参与推出的“最难LLMs评测榜”LiveBench、谷歌主导的指令遵循能力IFEval评测集，以及加州大学伯克利分校等提出的函数调用准确性评测BFCL中，QwQ-32B的得分甚至反超了DeepSeek-R1。

这些数据说明了什么？它意味着在推理能力这条赛道上，开源阵营已经涌现出不输甚至局部超越闭源模型的选手，而且参数量更小、成本更低。

消费级显卡即可完成本地部署

这是QwQ-32B最吸引人的亮点之一。它既提供了强大的推理能力，又将资源消耗控制在较低水平。对于追求快速响应或对数据安全有较高要求的应用场景而言，这简直是量身定制的解决方案。

开发者和企业可以轻松在消费级硬件上完成本地部署，比如常见的中高端PC或工作站，无需依赖云端资源。在此基础上，还能进一步进行微调和定制，打造专属的AI方案。这才是真正让开发者兴奋的地方——门槛降低了，想象空间打开了。

更值得一提的是，QwQ-32B模型内部还集成了智能体Agent的相关能力。简单来说，它不仅能推理，还能边使用工具边思考，并根据环境反馈动态调整推理过程。通义团队表示，下一步将继续探索智能体与强化学习的深度融合，推动长时推理能力的发展，最终目标自然是更高层次的智能，乃至AGI。

多种模型调用方式

目前QwQ-32B已经在魔搭社区和HuggingFace上架，采用Apache2.0协议开源，任何人都可以免费下载模型进行本地部署，或者通过阿里云百炼平台直接调用模型API服务。

如果你有云端部署的需求，也可以选择阿里云PAI平台快速部署，并进行模型微调、评测和应用搭建；或者通过容器服务ACK搭配阿里云GPU算力（比如GPU云服务器、容器计算服务ACS等），实现容器化部署和高效推理。

从2023年至今，通义团队已经开源了超过200款模型，覆盖了从文本、视觉、语音到文生图和视频的“全模态”，从0.5B到110B的“全尺寸”参数范围。在Chatbot Arena、司南OpenCompass等权威榜单上多次斩获“全球开源冠军”。截至目前，海内外社区中千问Qwen的衍生模型数量已突破10万，超越了美国Llama系列模型，成为全球最大的开源模型族群。

QwQ-32B的发布，不过是这条开源长征路上的又一次重要落子。但对于整个行业来说，它意味着更多人能够更自由地使用顶尖的推理能力——这才是开源真正的魅力所在。

来源：https://www.53ai.com/news/OpenSourceLLM/2025030606378.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。