Meta推出MobileLLM-R1系列AI模型:10亿参数内专精数学与编程
Meta 公司在 9 月 22 日正式发布了 MobileLLM-R1 系列轻量级语言模型。该系列包含 1.4 亿、3.6 亿和 9.5 亿参数三个版本,专门针对移动设备等低功耗平台优化,可高效运行于本地环境中。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

与传统通用聊天机器人不同,MobileLLM-R1 采用监督式微调(SFT)进行针对性训练,专注于解决数学计算、编程开发(支持 Python 和 C++)以及科研领域的专业问题。以旗舰型号 MobileLLM-R1 950M 为例,其预处理数据仅消耗约 2TB 精炼的 token 数据,总训练数据量控制在 5TB 以内。尽管如此,该模型在 MATH、GSM8K、MMLU 和 LiveCodeBench 等专业测试中表现优异,甚至超越了使用 36TB token 数据训练的 Qwen 3-0.6B 模型。
性能测试显示,在 MATH 评测中,950M 版本的准确率达到了 Olmo 1.24B 的五倍,是 SmolLM 1.7B 的两倍。编程任务的处理能力也明显优于这两个同类型开源模型。
开发者当前可通过 vLLM 推理引擎部署 MobileLLM-R1,只需在 ModelRegistry 中注册 Llama4ForCausalLM 架构即可。该系列产品以 Apache 2.0 协议开源,完整模型资源已同步上传至 Hugging Face 平台(访问链接)。
相关攻略
henry 发自 凹非寺量子位 | 公众号 QbitAI能无限进步的「超级智能体」来了!最近,Meta研究团队的一篇题为HYPERAGENTS(超级智能体)的论文迅速刷屏。这篇论文将LSTM之父Jü
来源:环球市场播报近日被Meta收购的人工智能初创公司Manus于周一推出了一款全新桌面应用,可将其AI智能体直接部署到个人笔记本电脑上。该公司的通用智能体能够执行复杂的多步骤任务,此前仅在云端运行
智东西编译 佳扬编辑 云鹏智东西3月30日消息,据彭博社报道,Meta计划下周推出两款全新Ray-Ban智能眼镜,专为佩戴近视眼镜的人士设计。消息人士透露,新款眼镜为矩形和圆形两种款式,主要通过传统
IT之家 3 月 30 日消息,Meta 当地时间本月 27 日宣布与美国路易斯安那州电力企业 Entergy Louisiana 达成一份新协议,为其在该州里奇兰教区 (Richland Pari
智通财经获悉,上周,一项针对Meta(META US)和谷歌(GOOGL US)具有里程碑意义的社交媒体成瘾诉讼在洛杉矶迎来裁决,这一判决或将对这两家公司乃至其竞争对手的运营模式产生深远影响。然而,
热门专题
热门推荐
IT之家 3 月 31 日消息,小米新一代 SU7 已于本月(3 月 19 日晚)正式上市,售价 21 99 万-30 39 万元。小米新一代 SU7 的超级小爱迎来了全新升级,小米智能助手最新微博
AO3镜像 当前可用地址为https: archiveofourown org ,另提供https: ao3 cubeart club 、https: xiaozhan ic
在网络环境日益复杂的今天,保障邮箱信息安全至关重要。qq邮箱提供了ssl加密功能,能有效提升邮件传输的安全性,防止信息被窃取或篡改。下面就来详细介绍如何开启qq邮箱的ssl加密。登
在望月天月市这个充满奇幻与神秘的地方,角色千里犹如一颗独特的星辰,散发着别样的魅力。千里拥有着出众的外貌。他有着一头乌黑亮丽的短发,总是显得精神抖擞。深邃的眼眸犹如夜空中闪烁的星辰
播得轰轰烈烈的《逐玉》,终于是会员大结局了。之前网传的庆功宴,也是没机会举办。《逐玉》这部剧,也是从开播就伴随着争议。直到最后大结局播出,观众都能感受到剧情的前言不搭后语,拿个6 8分都是抬高它了。





