首页 游戏 软件 资讯 排行榜 专题
首页
AI
新浪微博开源VibeThinker-1.5B:1.5B小模型挑战千亿巨量参数

新浪微博开源VibeThinker-1.5B:1.5B小模型挑战千亿巨量参数

热心网友
80
转载
2025-11-14

11月13日,新浪微博正式发布了其首个开源大模型 VibeThinker-1.5B,主打“小模型也能拥有大智慧”的理念。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

以下是该模型的核心介绍:

当前行业顶尖模型的参数量普遍突破1万亿,部分甚至达到2万亿规模。这不禁让人思考:是否只有庞大的参数才能实现高度智能?是否只有少数科技巨头才有能力打造大模型?

VibeThinker-1.5B 正是微博AI对这一问题的有力回应,它证明了小模型同样可以实现高智商表现。这意味着构建最强模型不再像传统认知那样主要依赖堆砌参数量,通过巧妙的算法设计同样能够达到这一目标。

这款模型仅包含15亿参数,经过微博AI研发团队提出的创新“频谱到信号原理”(SSP)训练方法后,其表现令人惊艳:VibeThinker 在 AIME24、AIME25 以及 HMMT25 三个高难度数学测试集上的表现,超越了参数量超过其400倍的 DeepSeek-R1-0120 版本(模型大小671B),与规模为456B的 MiniMax-M1 效果相当或更优;在 LiveCodeBench v6(编程算法题测试集)中的成绩,成功追平参数量数十倍于它的模型,比如欧洲领先AI企业 Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

VibeThinker 的强大能力并非来自参数堆砌,而是源于微博研发团队提出的 SSP 训练理念。该理念强调在学习阶段鼓励模型发散探索所有可能的解题路径,而非一味关注正确率;随后通过强化学习进行高效策略优化,精准锁定正确路径,将模型性能提升至极致。

该模型的单次“后训练”(Post-Training)成本不足8000美元。相比之下,DeepSeek-R1 和 MiniMax-M1 的后训练成本分别是29万美元及53万美元,成本降低了数十倍。

VibeThinker-1.5B 的开源,旨在为全球计算资源有限的中型企业及高校研究团队,提供一条高性价比的研发新路径。这使得人人都可以训练最前沿的大模型,而不像之前那样被排斥在外,这对于业界技术进步至关重要。

Github:https://github.com/WeiboAI/VibeThinker

HuggingFace:https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv:https://arxiv.org/pdf/2511.06221

ModelScope:https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

来源:https://www.ithome.com/0/897/269.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenClaw逼出Claude最强反击!实现类人操控,需消耗多少Token?
AI
OpenClaw逼出Claude最强反击!实现类人操控,需消耗多少Token?

Claude Code这次升级精准反击了OpenClaw,补齐了开源项目没完善的痛点。 “Anthropic刚刚杀死了OpenClaw。”这是Claude Code最新升级Computer Use能

热心网友
03.26
微信接入Claude Code:轻松连上开源神器龙虾
科技数码
微信接入Claude Code:轻松连上开源神器龙虾

Nexu 是一个开源的桌面客户端,定位为:OpenClaw 的图形化控制台 + 多平台接入工具。 昨天周末,微信刚刚推出了「ClawBot」插件,正式支持接入OpenClaw。不过很多人可能还没来得

热心网友
03.25
PineTime Pro智能手表发布:AMOLED屏、内置GPS和血氧监测
礼仪与书信
PineTime Pro智能手表发布:AMOLED屏、内置GPS和血氧监测

IT之家 3 月 25 日消息,制造商 Pine64 预热将推出一款 PineTime Pro 开源智能手表,不过尚未公布该产品的具体上市时间及定价信息。参考最新预热,目前已知该手表将配备一块 AM

热心网友
03.25
运维挖宝指南:没有公网IP的替代方案全解析
科技数码
运维挖宝指南:没有公网IP的替代方案全解析

NPS 是一款开源的内网穿透工具,通过强大协议支持与便捷的Web前端管理,帮助用户访问内网 、测试支付接口、远程桌面连接、内网DNS解析等。 NPS是一款轻量级、高性能的内网穿透代理服务器,支持多种

热心网友
03.17
腾讯开源强化学习框架WorldCompass,面向世界模型后训练
AI
腾讯开源强化学习框架WorldCompass,面向世界模型后训练

IT之家 3 月 10 日消息,腾讯混元 3D 团队今日宣布开源业界首个面向世界模型的强化学习后训练框架 WorldCompass,这是此前发布的混元世界模型 1 5 最新强化学习扩展模块,能够让世

热心网友
03.10

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

鲁大师软件管家使用教程:一键升级常用电脑软件
电脑教程
鲁大师软件管家使用教程:一键升级常用电脑软件

鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;

热心网友
03.29
北京推进智能网联新能源车险,支持L2-L4级别统一适配
科技数码
北京推进智能网联新能源车险,支持L2-L4级别统一适配

3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失

热心网友
03.29
苹果今年将发布两款新iPhone应用,包含聊天机器人
科技数码
苹果今年将发布两款新iPhone应用,包含聊天机器人

预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple

热心网友
03.29
苹果聘请前谷歌副总裁分管AI产品营销
科技数码
苹果聘请前谷歌副总裁分管AI产品营销

据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有

热心网友
03.29
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀
科技数码
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀

3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个

热心网友
03.29