游乐游手机版
首页/AI热点日报/热点详情

阿里QwQ-32B正式发布或成671B最佳替代方案

类型:热点整理2026-07-02
2025年3月6日,阿里云通义千问官方微博正式发布了全新的推理模型——QwQ-32B,并同步进行开源。该模型虽然仅拥有320亿参数,但其性能表现足以与拥有6710亿参数的DeepSeek-R1正面较量——需要注意的是,后者实际被激活的参数也仅为370亿。这意味着,在数学推理、代码生成以及通用智能等关
2025年3月6日,阿里云通义千问官方微博正式发布了全新的推理模型——QwQ-32B,并同步进行开源。该模型虽然仅拥有320亿参数,但其性能表现足以与拥有6710亿参数的DeepSeek-R1正面较量——需要注意的是,后者实际被激活的参数也仅为370亿。这意味着,在数学推理、代码生成以及通用智能等关键领域,小参数模型同样能够与大模型一较高下,且资源消耗显著更低。 先来看看官方发布的截图: 在开源方面,阿里云选择在 Hugging Face 与 ModelScope 两大平台同步开源,采用 Apache 2.0 协议。这意味着任何个人或企业均可自由下载、商用,无需担心授权问题。在 Hugging Face 的大模型排行榜上,QwQ-32B 已成功登顶,充分展现了其实力。 如果你也想体验这一模型,可以通过以下方式获取: - Hugging Face:https://huggingface.co/Qwen/QwQ-32B - hf 镜像站:http://hf-mirror.com/Qwen/QwQ-32B - Ollama:https://ollama.com/library/qwq 直接在 Ollama 拉取也非常简单,一条命令即可完成: ``` ollama run qwq ``` 对比 DeepSeek-R1 671B 满血版,QwQ-32B 在资源占用上的优势极为突出。在 Ollama 平台上,Q4 量化版仅需 20GB 显存,即使运行全量模型,所需显存也不超过 80GB,普通消费级显卡即可流畅推理。此外,有消息称该模型的研发获得了 DeepSeek 相关人员的技术支持——虽然未经官方证实,但如果属实,这次“小模型挑战大模型”的胜利将更加耐人寻味。 QwQ-32B 的发布对整个行业的影响不言而喻。尤其是那些此前花费巨资部署 DeepSeek-R1 满血版的企业,现在或许会感到一些压力。但换个角度来看,这恰恰是技术快速迭代带来的红利。自 DeepSeek 开源以来,大模型行业的创新速度明显加快,头部企业之间的竞争日趋白热化。对用户而言,这无疑是件好事——更低的成本、更强的性能,让 AI 落地变得更加触手可及。期待这些头部企业能带来更多像 QwQ-32B 这样的优秀作品。
来源:https://www.53ai.com/news/OpenSourceLLM/2025031113879.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。