2025年9月下旬,Meta发布了专为移动场景打造的MobileLLM-R1轻量化语言模型系列,推出1.4亿、3.6亿和9.5亿三款不同参数规模的版本,特别强化了在手机等终端设备上的本地化部署能力。
这一系列模型定位于专业任务处理,主要服务于数学运算、程序开发(支持Python和C++等主流语言)以及科学计算等特定领域。借助定制化的监督微调训练方法,即便在训练数据量受限的情况下依然表现出众。以旗舰款MobileLLM-R1 950M为例,其预训练阶段仅消耗约2TB的高质量token数据,总训练数据量严格控制在5TB以内,却在MATH、GSM8K等专业基准测试中力压预处理数据量达36TB的Qwen 3-0.6B等竞品。
与业界头部开源轻量模型相较,MobileLLM-R1 950M展现了显著的领先优势:数学解题准确率是Olmo 1.24B的五倍之多;相比SmolLM 1.7B也实现了两倍以上的性能突破。在代码生成等开发任务中,其表现同样全方位超越同类产品。
当前开发者可以通过vLLM推理框架快速部署该系列模型,只需在ModelRegistry中简单配置Llama4ForCausalLM架构即可调用。Meta已将这套模型按Apache 2.0开源协议完整开放,用户可自由从主流模型平台获取和使用。
