在9月19日举办的云栖大会上,阿里云CTO周靖人正式推出了通义千问新一代开源大模型Qwen2.5。此次发布的旗舰版本Qwen2.5-72B,直接对标Llama 405B,根据官方公布的评测数据,其性能已全面超越对手。

Qwen2.5系列覆盖了从轻量级到旗舰级的多种参数规模,涵盖大语言模型、多模态模型、数学推理模型以及代码生成模型。每个尺寸均提供基础版、指令跟随版和量化版,共计上线超过100个模型。具体型号分布如下:
- Qwen2.5 语言模型:0.5B、1.5B、3B、7B、14B、32B 以及 72B;
- Qwen2.5-Coder 编程模型:1.5B、7B,并即将推出32B版本;
- Qwen2.5-Math 数学推理模型:1.5B、7B 以及 72B。

除3B和72B两个版本外,通义千问所有开源模型均采用Apache 2.0许可证——这意味着在绝大多数场景下可以自由商用。开发者可以前往Hugging Face仓库查询对应的许可证文件。
此外,阿里云还通过Model Studio平台提供了旗舰语言模型Qwen-Plus和Qwen-Turbo的API接口。同期开源的还有Qwen2-VL-72B,相比上个月发布的版本,其性能表现进一步提升。
一组关键数据值得关注:截至2024年9月中旬,通义千问开源模型的累计下载量已突破4000万。这一数字在全球开源模型排行榜中仅次于Llama系列,稳居开源模型生态的第二位。
云栖大会还传来一个利好消息:阿里云宣布通义千问推荐模型全线降价,最高降幅达85%。对开发者而言,这意味着更强的模型能力与更低的使用门槛,进一步推动了AI技术的普及。
