游乐游手机版
首页/AI热点日报/热点详情

新浪VibeThinker-3B开源,模型变小能力不减,AI推理轻量化新思路

类型:热点整理2026-06-30
人工智能模型的参数量是否真的“越大越好”?近日,新浪开源的一款仅3B参数量的模型,交出了一份极具启发意义的答卷。这款模型名为 VibeThinker-3B,虽然它仅有30亿参数,却在数学、编程等高难度基准测试中,展现出足以媲美规模大上百倍的主流大模型的实力。更令人惊讶的是,在一些竞赛级任务中,它甚至

人工智能模型的参数量是否真的“越大越好”?近日,新浪开源的一款仅3B参数量的模型,交出了一份极具启发意义的答卷。

这款模型名为 VibeThinker-3B,虽然它仅有30亿参数,却在数学、编程等高难度基准测试中,展现出足以媲美规模大上百倍的主流大模型的实力。更令人惊讶的是,在一些竞赛级任务中,它甚至已经超越了多款行业顶尖产品。

VibeThinker-3B 的出色表现并非偶然,其核心在于独特的训练策略。该模型以阿里 Qwen2.5-Coder-3B 为基础,通过多阶段的精细化“后训练”——涵盖监督微调、强化学习、自蒸馏以及指令微调等环环相扣的环节,成功将大模型的逻辑推理能力浓缩进这个3B参数的轻量化架构中。实际测试数据更具说服力:在 LeetCode 竞赛题目中,它能高效完成128道题中的123道,这一成绩已超过 GPT-5.2 等行业标杆。

image.png

目前,VibeThinker-3B 已在 Hugging Face 和 GitHub 正式开源。这一举措不仅为开发者带来了一个轻量且高效的工具选择,更为 AI 行业提供了一种全新的优化思路:在某些特定任务领域,通过精耕细作的后训练,完全可以用极低的算力成本,换取堪比“行业巨头”的性能表现。这才是真正值得关注的信号——用更聪明的训练方法,而非单纯堆砌参数。

来源:https://news.aibase.com/zh/news/29236

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。