以色列创企开源3B轻量模型,性能超越谷歌Gemma
10月9日消息,以色列AI初创公司AI21 Labs最新发布了开源推理模型Jamba Reasoning 3B。这款仅30亿参数的轻量级模型能够在手机、PC等多种终端设备上流畅运行,其性能表现已超越Qwen3-4B、Gemma 3-4B等行业领先产品。

模型的Hugging Face开源地址:https://huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B
突破性的架构设计
AI21采用了创新的SSM-Transformer混合架构,使Jamba Reasoning 3B具备256K token的超长上下文窗口处理能力,最高可扩展到1M token。相比DeepSeek、谷歌Llama等同类产品,其在处理效率上提升了2-5倍。

三大核心优势
- 稳定的长文本处理能力:混合架构使模型在32K以上token处理时不会出现明显的性能衰减,非常适合多模态应用和高级智能体系统开发。
- 卓越的推理表现:在指令跟踪(IFBench)、常识推理(MMLU-Pro)等核心指标上超越竞品,得益于RLVR、SFT等创新训练技术的运用。
- 安全的本地部署:Apache 2.0许可证允许完全本地化部署,8倍优化的KV缓存使其在M3 MacBook Pro上可实现每秒40token的处理速度。

开启轻量型AI新纪元
当前支持英语、西班牙语、法语等9种语言处理。研究显示,40%-70%的AI任务可通过小型模型处理,相比云端方案可降低10-30倍成本。这种轻量级解决方案为制造业、医疗等领域的实时应用提供了新可能,推动AI技术向去中心化方向发展。
