新浪微博开源VibeThinker-1.5B：1.5B小模型挑战千亿巨量参数

首页

热心网友

转载

2025-11-14

11月13日，新浪微博正式发布了其首个开源大模型 VibeThinker-1.5B，主打“小模型也能拥有大智慧”的理念。

以下是该模型的核心介绍：

当前行业顶尖模型的参数量普遍突破1万亿，部分甚至达到2万亿规模。这不禁让人思考：是否只有庞大的参数才能实现高度智能？是否只有少数科技巨头才有能力打造大模型？

VibeThinker-1.5B 正是微博AI对这一问题的有力回应，它证明了小模型同样可以实现高智商表现。这意味着构建最强模型不再像传统认知那样主要依赖堆砌参数量，通过巧妙的算法设计同样能够达到这一目标。

这款模型仅包含15亿参数，经过微博AI研发团队提出的创新“频谱到信号原理”（SSP）训练方法后，其表现令人惊艳：VibeThinker 在 AIME24、AIME25 以及 HMMT25 三个高难度数学测试集上的表现，超越了参数量超过其400倍的 DeepSeek-R1-0120 版本（模型大小671B），与规模为456B的 MiniMax-M1 效果相当或更优；在 LiveCodeBench v6（编程算法题测试集）中的成绩，成功追平参数量数十倍于它的模型，比如欧洲领先AI企业 Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。

新浪微博发布其首个开源大模型 VibeThinker-1.5B，小模型挑战巨量参数对手

VibeThinker 的强大能力并非来自参数堆砌，而是源于微博研发团队提出的 SSP 训练理念。该理念强调在学习阶段鼓励模型发散探索所有可能的解题路径，而非一味关注正确率；随后通过强化学习进行高效策略优化，精准锁定正确路径，将模型性能提升至极致。

该模型的单次“后训练”（Post-Training）成本不足8000美元。相比之下，DeepSeek-R1 和 MiniMax-M1 的后训练成本分别是29万美元及53万美元，成本降低了数十倍。

VibeThinker-1.5B 的开源，旨在为全球计算资源有限的中型企业及高校研究团队，提供一条高性价比的研发新路径。这使得人人都可以训练最前沿的大模型，而不像之前那样被排斥在外，这对于业界技术进步至关重要。

Github：https://github.com/WeiboAI/VibeThinker

HuggingFace：https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv：https://arxiv.org/pdf/2511.06221

ModelScope：https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

来源:https://www.ithome.com/0/897/269.htm

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：大疆Action 6体验：不称Pro，实力更Pro的运动相机下一篇：蚂蚁集团与浙大共建AI+Data认知计算中心，聚焦大数据

相关攻略

业界动态

RPA开源软件推荐与选择指南

深夜，一位电商运营专员仍在手动将数千条订单数据从一个平台复制粘贴到另一个系统；而隔壁技术团队的工程师，早已通过简洁的脚本指令，让“数字员工”在十分钟内精准无误地完成了全部工作。这巨大效率差距的背后，核心驱动力正是机器人流程自动化（RPA）技术。如今，开源RPA框架已成为众多企业和开发者实践自动化、

热心网友

05.17

开源洁癖技能让智能体越用越聪明

在AI辅助开发的日常中，我们常常会遇到一个令人头疼的问题：项目初期文档清晰、记忆整洁，但随着功能迭代和Bug修复，代码库越来越庞大，而配套的文档和AI记忆却逐渐“腐化”，变得过时甚至矛盾。这直接导致了一个普遍现象——你的AI助手似乎越用越“笨”，给出的建议开始偏离实际，甚至犯下一些莫名其妙的错误。

热心网友

05.17

阿里通义开源全模态RAG框架VimRAG详解

在多模态人工智能处理领域，传统的检索增强生成（RAG）框架长期面临一个核心瓶颈：它们通常专精于文本处理，一旦涉及图像、视频等非文本信息，要么需要依赖OCR等技术进行“翻译”，要么就完全无法处理。这种割裂的处理模式不仅损失了原始数据的丰富语义和视觉细节，也让整个推理过程如同黑箱，难以追溯、验证与优化。

热心网友

05.17