时间:2025-08-07 作者:游乐小编
8月7日最新消息,阿里云通义千问团队昨日(8月6日)正式发布了两款全新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507,在性能表现上实现了显著突破。
官方特别强调,这类小型语言模型(SLM)在推动Agentic AI发展方面具有独特价值。此次发布的"2507"版本Qwen3-4B模型不仅体积小巧,性能表现也相当出色,特别适合在手机等终端设备上部署运行。
根据官方博文介绍,Qwen3-4B-Instruct-2507在非推理领域展现出更强的通用能力,有望成为终端设备的智能助手。该模型不仅支持更多语言和长尾知识处理,还将上下文理解能力扩展到256K,让小型模型也能轻松应对长文本任务。在性能测试中,其通用能力不仅超越了闭源的小型模型GPT-4.1-nano,甚至接近规模更大的Qwen3-30B-A3B(非推理版本)。
官方将这款模型比作一位高效的"执行专家",特别擅长快速响应指令,在内容创作、工具调用等场景中表现尤为突出。
而在推理能力方面,Qwen3-4B-Thinking-2507的表现同样令人惊艳。该模型在AIME25测试中取得了81.3分的高分,推理能力可与中等规模的Qwen3-30B-Thinking相媲美。特别值得一提的是,这个仅有4B参数的模型在侧重数学能力的AIME25测评中,竟能获得81.3分的优异成绩。
官方形象地将这款模型描述为一位严谨的"学术专家",特别擅长通过逐步推理来解决复杂问题,在完成深度任务时展现出更强的可靠性。
2021-11-05 11:52
手游攻略2021-11-19 18:38
手游攻略2021-10-31 23:18
手游攻略2022-06-03 14:46
游戏资讯2025-06-28 12:37
单机攻略