Meta推出MobileLLM-R1系列AI模型:10亿参数内专精数学与编程
Meta 公司在 9 月 22 日正式发布了 MobileLLM-R1 系列轻量级语言模型。该系列包含 1.4 亿、3.6 亿和 9.5 亿参数三个版本,专门针对移动设备等低功耗平台优化,可高效运行于本地环境中。
与传统通用聊天机器人不同,MobileLLM-R1 采用监督式微调(SFT)进行针对性训练,专注于解决数学计算、编程开发(支持 Python 和 C++)以及科研领域的专业问题。以旗舰型号 MobileLLM-R1 950M 为例,其预处理数据仅消耗约 2TB 精炼的 token 数据,总训练数据量控制在 5TB 以内。尽管如此,该模型在 MATH、GSM8K、MMLU 和 LiveCodeBench 等专业测试中表现优异,甚至超越了使用 36TB token 数据训练的 Qwen 3-0.6B 模型。
性能测试显示,在 MATH 评测中,950M 版本的准确率达到了 Olmo 1.24B 的五倍,是 SmolLM 1.7B 的两倍。编程任务的处理能力也明显优于这两个同类型开源模型。
开发者当前可通过 vLLM 推理引擎部署 MobileLLM-R1,只需在 ModelRegistry 中注册 Llama4ForCausalLM 架构即可。该系列产品以 Apache 2.0 协议开源,完整模型资源已同步上传至 Hugging Face 平台(访问链接)。
相关攻略

10 月 8 日消息,据英媒《金融时报》今天报道,苹果、Meta 等软硬件巨头正与欧盟进行私下谈判,双方已接近达成协议,此前苹果曾因违反《数字市场法》,被欧盟总计罚款 7 亿欧元。知情人士透露,两

10 月 7 日消息,Meta 发文,宣布开源一套名为 OpenZL 的无损压缩框架,目前相应框架源代码已在 GitHub 上开放(点此访问)。据介绍,该框架设计理念为“先定义清楚数据结构,再根据

10月6日消息,据IT之家援引彭博社报道,苹果公司正为其人工智能(AI)部门寻找新的负责人,以接替现任主管 John Giannandrea。据报道,此次人事变动的直接起因是 Apple Intel

10 月 5 日消息,据《商业内幕》4 日报道,Meta 正通过今年早些时候推出的“仪表盘”追踪各团队的 AI 使用情况,并推出一款游戏来提升员工的参与度。不同团队对 AI 使用的要求不同。一些部

在近日 Meta AI 的一场内部震荡中,首席 AI 科学家 Yann LeCun 愤然表示考虑辞去职务,导火索是 Meta 关于 FAIR 发布研究成果方面的一项新规定,引发了 LeCun 以及
热门专题


最新APP
热门推荐
当夜幕缓缓降临忠县,一场与“超级月亮”的浪漫邂逅悄然上演。在柔和月光的映照下,整个夜空宛如被披上了一层梦幻的薄纱,显得格外迷人。据悉,今年中秋月的最圆时刻定格在10月7日(农历八月十六)11时48分

剑星女主角伊芙的原型模特申才恩近日在社交平台分享了一组特别的作品——她利用AI技术将自己形象生成为虚拟手办。从发布的内容来看,即便经过数字化处理,依然能清晰展现出她出众的身材比例与立体美感。这一创意

今晚八点整,影驰京东自营旗舰店将正式打响双十一首波福利活动!“评价抽好礼”即日启动,活动持续至11月11日23:59,买显卡即有机会赢取百元京东E卡、机械键盘等多重豪礼!在影驰京东自营旗舰店购买RT

DNF勋章三觉后守护珠也要换成命运宝石,每个职业都有一些技能会受到命运宝石的强化,那么女柔道的命运宝石属性是什么?下面就给大家带来DNF女柔道命运宝石属性介绍。DNF女柔道命运宝石
一款问世二十余年的游戏,至今仍有大量玩家沉浸其中,仿佛对它有着难以割舍的执念——它就是《红色警戒2》。在许多人的记忆里,这款游戏曾是课余时光的“标配”,如今,依然有一群人以各种方式延续着对它的热爱。