首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
Meta推出MobileLLM-R1系列AI模型:10亿参数内专精数学与编程

Meta推出MobileLLM-R1系列AI模型:10亿参数内专精数学与编程

热心网友
18
转载
2025-09-23

Meta 公司在 9 月 22 日正式发布了 MobileLLM-R1 系列轻量级语言模型。该系列包含 1.4 亿、3.6 亿和 9.5 亿参数三个版本,专门针对移动设备等低功耗平台优化,可高效运行于本地环境中。

Meta

与传统通用聊天机器人不同,MobileLLM-R1 采用监督式微调(SFT)进行针对性训练,专注于解决数学计算、编程开发(支持 Python 和 C++)以及科研领域的专业问题。以旗舰型号 MobileLLM-R1 950M 为例,其预处理数据仅消耗约 2TB 精炼的 token 数据,总训练数据量控制在 5TB 以内。尽管如此,该模型在 MATH、GSM8K、MMLU 和 LiveCodeBench 等专业测试中表现优异,甚至超越了使用 36TB token 数据训练的 Qwen 3-0.6B 模型。

性能测试显示,在 MATH 评测中,950M 版本的准确率达到了 Olmo 1.24B 的五倍,是 SmolLM 1.7B 的两倍。编程任务的处理能力也明显优于这两个同类型开源模型。

开发者当前可通过 vLLM 推理引擎部署 MobileLLM-R1,只需在 ModelRegistry 中注册 Llama4ForCausalLM 架构即可。该系列产品以 Apache 2.0 协议开源,完整模型资源已同步上传至 Hugging Face 平台(访问链接)。

来源:https://www.ithome.com/0/884/922.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Meta裁员幸存者面临职业困境与转型抉择
AI资讯
Meta裁员幸存者面临职业困境与转型抉择

Meta裁员后的“幸存者”面临组织剧变。部分工程经理被要求转回个人贡献者岗位,顶尖工程师则被调去做AI数据标注。公司全力押注AI与效率,推动结构扁平化,传统管理角色被压缩。这些调整引发员工去留困境,也折射出巨头为构建数据护城河,不惜将内部顶尖人才转化为AI训练资源的战略转向。

热心网友
05.25
日本上市公司Metaplanet发行5000万美元零息债券 用于增持比特币BTC
web3.0
日本上市公司Metaplanet发行5000万美元零息债券 用于增持比特币BTC

Metaplanet再出重拳:80亿日元零息债券全数加仓比特币 日本资本市场与加密资产的融合正进入新阶段。东京证券交易所上市公司Metaplanet Inc (股票代码:3350)于近日发布官方公告,宣布已成功向专业投资机构EVO FUND发行了价值80亿日元(约合5000万美元)的零息可转换债券。

热心网友
05.24
Meta裁员8000人背后 AI技术革新引发行业震荡
科技数码
Meta裁员8000人背后 AI技术革新引发行业震荡

Meta大规模裁员计划正式启动,凌晨向全球员工发出通知,计划削减约8000个岗位,约占员工总数10%,工程、产品及合规等多个团队均受影响。同时,公司推出监控工具,追踪员工键盘、鼠标及屏幕活动以训练AI,员工无法拒绝使用。首席技术官坦言员工普遍对未来感到焦虑。

热心网友
05.24
MetaDao暴涨10倍后 还有哪些潜力Web3项目值得埋伏
web3.0
MetaDao暴涨10倍后 还有哪些潜力Web3项目值得埋伏

MetaDao暴涨10倍:市场热潮下的新机会与冷静思考 最近,MetaDao价格在短时间内飙升了10倍,这个现象无疑在市场上投下了一颗重磅冲击波,吸引了无数投资者的目光。大家的热议焦点很自然地转向了一个问题:除了它,还有哪些项目可能蕴藏着类似的高成长潜力? 值得关注的潜力项目 市场热度被点燃后,资金

热心网友
05.23
Meta在建AI数据中心被指污染水源 居民生活用水依赖外运
业界动态
Meta在建AI数据中心被指污染水源 居民生活用水依赖外运

Meta在佐治亚州建设数据中心导致当地饮用水浑浊,居民被迫外运水维持生活。此事已进入国会听证,议员向环保署官员展示污染水样并质询项目对水资源的广泛影响。官员承诺将优先调查并确保水质符合标准。

热心网友
05.23

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Notion AI备考指南:高效搭建错题本与复习系统
AI资讯
Notion AI备考指南:高效搭建错题本与复习系统

备考时错题管理常因分散无序而低效。NotionAI可构建智能错题系统:创建带AI字段的数据库自动分类错题;利用双向链接建立知识点网络,关联薄弱环节;通过侧边栏AI深度分析错因;配置基于掌握等级的间隔复习提醒;考前还能批量生成个性化复习试卷。该系统实现了错题的动态管理与高效复习。

热心网友
05.25
Duck AI 隐私政策解读 数据处理与使用关键条款详解
AI资讯
Duck AI 隐私政策解读 数据处理与使用关键条款详解

Duck ai通过五大机制保障数据隐私:传输时匿名化处理;交互数据会话结束即销毁;禁止将用户数据用于模型训练;上传图片强制清除隐私元数据;默认数据本地存储,实现“零云端持久化”。这些措施环环相扣,最大限度减少数据暴露与留存。

热心网友
05.25
豆包AI翻译中英文文档使用教程
AI资讯
豆包AI翻译中英文文档使用教程

豆包AI翻译中英文混合文档时,需注意文档格式支持与操作指令。关键步骤包括:上传可编辑文档并明确指定双语分区指令;网页端可锁定语言对并固化术语;移动端借助OCR处理图片文档;专业文档建议分段校准并固化术语表;还可利用侧边栏翻译控件精确设置语言对与分区模式。

热心网友
05.25
闭安山寨币交易手续费详解与节省技巧
web3.0
闭安山寨币交易手续费详解与节省技巧

闭安山寨币交易费用受多种因素影响,包括网络拥堵程度、交易类型和Gas价格设置。与以太坊主网相比,其Layer2解决方案通常能显著降低费用,但不同山寨币项目间的成本差异依然存在。用户可通过选择合适时机交易、利用费用预估工具及参与生态激励来优化成本。总体而言,闭安生态正通过技术升级持续改善交易费用体验。

热心网友
05.25
即梦AI浮雕立体字制作教程 轻松生成3D特效文字
AI资讯
即梦AI浮雕立体字制作教程 轻松生成3D特效文字

在即梦AI中制作浮雕立体字,可选用内置模板快速生成,或通过结构化提示词精细控制光影与材质细节。对初步结果可利用局部重绘功能强化结构,还可结合Firefly插件生成光照贴图以提升质感,实现更真实的立体效果。

热心网友
05.25