首页 游戏 软件 资讯 排行榜 专题
首页
AI
新浪微博开源VibeThinker-1.5B:1.5B小模型挑战千亿巨量参数

新浪微博开源VibeThinker-1.5B:1.5B小模型挑战千亿巨量参数

热心网友
93
转载
2025-11-14

11月13日,新浪微博正式发布了其首个开源大模型 VibeThinker-1.5B,主打“小模型也能拥有大智慧”的理念。

以下是该模型的核心介绍:

当前行业顶尖模型的参数量普遍突破1万亿,部分甚至达到2万亿规模。这不禁让人思考:是否只有庞大的参数才能实现高度智能?是否只有少数科技巨头才有能力打造大模型?

VibeThinker-1.5B 正是微博AI对这一问题的有力回应,它证明了小模型同样可以实现高智商表现。这意味着构建最强模型不再像传统认知那样主要依赖堆砌参数量,通过巧妙的算法设计同样能够达到这一目标。

这款模型仅包含15亿参数,经过微博AI研发团队提出的创新“频谱到信号原理”(SSP)训练方法后,其表现令人惊艳:VibeThinker 在 AIME24、AIME25 以及 HMMT25 三个高难度数学测试集上的表现,超越了参数量超过其400倍的 DeepSeek-R1-0120 版本(模型大小671B),与规模为456B的 MiniMax-M1 效果相当或更优;在 LiveCodeBench v6(编程算法题测试集)中的成绩,成功追平参数量数十倍于它的模型,比如欧洲领先AI企业 Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

VibeThinker 的强大能力并非来自参数堆砌,而是源于微博研发团队提出的 SSP 训练理念。该理念强调在学习阶段鼓励模型发散探索所有可能的解题路径,而非一味关注正确率;随后通过强化学习进行高效策略优化,精准锁定正确路径,将模型性能提升至极致。

该模型的单次“后训练”(Post-Training)成本不足8000美元。相比之下,DeepSeek-R1 和 MiniMax-M1 的后训练成本分别是29万美元及53万美元,成本降低了数十倍。

VibeThinker-1.5B 的开源,旨在为全球计算资源有限的中型企业及高校研究团队,提供一条高性价比的研发新路径。这使得人人都可以训练最前沿的大模型,而不像之前那样被排斥在外,这对于业界技术进步至关重要。

Github:https://github.com/WeiboAI/VibeThinker

HuggingFace:https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv:https://arxiv.org/pdf/2511.06221

ModelScope:https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

来源:https://www.ithome.com/0/897/269.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

RPA开源软件推荐与选择指南
业界动态
RPA开源软件推荐与选择指南

深夜,一位电商运营专员仍在手动将数千条订单数据从一个平台复制粘贴到另一个系统;而隔壁技术团队的工程师,早已通过简洁的脚本指令,让“数字员工”在十分钟内精准无误地完成了全部工作。 这巨大效率差距的背后,核心驱动力正是机器人流程自动化(RPA)技术。如今,开源RPA框架已成为众多企业和开发者实践自动化、

热心网友
05.17
开源洁癖技能让智能体越用越聪明
AI
开源洁癖技能让智能体越用越聪明

在AI辅助开发的日常中,我们常常会遇到一个令人头疼的问题:项目初期文档清晰、记忆整洁,但随着功能迭代和Bug修复,代码库越来越庞大,而配套的文档和AI记忆却逐渐“腐化”,变得过时甚至矛盾。这直接导致了一个普遍现象——你的AI助手似乎越用越“笨”,给出的建议开始偏离实际,甚至犯下一些莫名其妙的错误。

热心网友
05.17
阿里通义开源全模态RAG框架VimRAG详解
AI
阿里通义开源全模态RAG框架VimRAG详解

在多模态人工智能处理领域,传统的检索增强生成(RAG)框架长期面临一个核心瓶颈:它们通常专精于文本处理,一旦涉及图像、视频等非文本信息,要么需要依赖OCR等技术进行“翻译”,要么就完全无法处理。这种割裂的处理模式不仅损失了原始数据的丰富语义和视觉细节,也让整个推理过程如同黑箱,难以追溯、验证与优化。

热心网友
05.17
最强开源图像生成模型GPT-Image-2平替版正式发布
AI
最强开源图像生成模型GPT-Image-2平替版正式发布

全球AI图像生成领域的竞争格局,正迎来前所未有的激烈变革与范式升级。 就在上周,OpenAI正式推出GPT-Image-2,其卓越的视觉表现力与精准的文本遵循能力引发了行业广泛关注。无论是高度拟真的电商直播场景、充满复古质感的90年代风格照片,还是逻辑缜密的知识图谱可视化,一系列令人惊叹的演示案例迅

热心网友
05.17
浙江大学与哈佛开源UniGeo实现高保真相机可控编辑
AI
浙江大学与哈佛开源UniGeo实现高保真相机可控编辑

在影视特效、虚拟现实和三维内容创作中,一个关键难题是如何让AI仅凭一张静态图片,就能准确生成不同相机角度下的新视图。这不仅需要简单的画面旋转,更依赖于对场景三维结构的深度理解与重建。目前的主流技术大多基于图像扩散模型,通过处理离散的视角映射已取得显著进展。 然而,当面对真实拍摄中平滑、连续的相机运动

热心网友
05.16

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

亚马逊FNSKU标签制作全流程:生成打印与贴标指南
业界动态
亚马逊FNSKU标签制作全流程:生成打印与贴标指南

在亚马逊FBA运营中,商品入仓前正确粘贴FNSKU标签是至关重要的第一步。这串看似简单的条形码,直接决定了库存的精准识别、订单的准确履行,更是构建品牌库存护城河、有效防止跟卖的核心防线。切勿轻视——标签打印模糊、粘贴位置错误,极易导致货物被FBA仓库拒收,甚至引发库存数据混乱,造成不必要的损失。 本

热心网友
05.17
逸剑风云决厂卫相助会触发哪些隐藏剧情
游戏攻略
逸剑风云决厂卫相助会触发哪些隐藏剧情

在《逸剑风云决》的武侠世界中,玩家时常会遭遇身陷重围、濒临绝境的危机时刻。而就在这胜负将分的紧要关头,有时会有一股神秘力量骤然介入,彻底扭转战局——那便是行事诡秘的厂卫。他们的登场,绝非寻常的“援军抵达”,更像是一把精心设计的钥匙,悄然开启了江湖帷幕背后,那重更为错综复杂、暗流涌动的剧情篇章。 逸剑

热心网友
05.17
绝地求生电波干扰背包功能详解与使用指南
游戏攻略
绝地求生电波干扰背包功能详解与使用指南

《绝地求生》第41赛季已全面开启,备受玩家关注的“电波干扰背包”迎来了自上线以来最大规模的机制重做。官方更新日志已经发布,本文将为您深入解析本次调整的核心要点与实战影响,帮助您在新赛季中精准掌握这件战术装备的全新玩法。 简而言之,本次更新的核心理念是“风险与收益的再平衡”。开发团队显然评估了该背包在

热心网友
05.17
绯月絮语最强阵容搭配攻略与角色组合推荐
游戏攻略
绯月絮语最强阵容搭配攻略与角色组合推荐

打造一套高胜率的绯月絮语阵容,核心在于角色间的精准定位与战术协同。这不仅仅是简单堆砌高战力角色,更需要深入理解各位置的战略职能,以及他们如何通过技能组合产生“1+1>2”的团队效应。 核心输出角色的选择 阵容的战术轴心通常由一至两位核心输出角色奠定。例如,以极致单体爆发见长的[角色名 1],其终结技

热心网友
05.17
Temu注册码15位错误原因与解决方法详解
业界动态
Temu注册码15位错误原因与解决方法详解

在跨境电商领域,Temu凭借其独特的全托管模式和强大的供应链整合能力,已成为众多卖家出海拓展业务的重要选择。然而,不少卖家在准备入驻时,常被一个看似简单的系统提示所阻碍——“注册码长度为15位”,导致注册流程中断,甚至可能错失快速开店的宝贵时机。 本文将深入解析此问题的根本原因,并提供一套清晰、可操

热心网友
05.17