陈天桥入局小模型:用30B参数跑赢千亿赛道

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
2026 年小模型或成为关键。
作者|徐珊
编辑|郑玄
如果说 2025 年 DeepSeek 的爆发让全球意识到算力并非通往 AGI 的唯一方式,那么 2026 年开年,MiroThinker 1.5 的发布,让人更关注小模型的潜力所在。
MiroThinker 1.5 是盛大集团创始人陈天桥与 AI 科学家代季峰创办的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通过 其 30B 小模型规格,通过极小的算力调度,在复杂推理任务中取得了不输大模型的表现,同时响应速度更快、成本更低、智能表现效果更好。目前,MiroThinker 1.5 正处于公开发布阶段,人人皆可上手免费使用。
除了 MiroThinker 1.5 性能表现优越以外,MiroThinker 备受关注的另一大原因是,这是一个强强联手打造出来的创业项目。
MiroMind 是陈天桥在 AI 领域,少有的,自己下场主导并参与的创业项目,他曾凭借《传奇》缔造网游神话、登顶中国首富。在淡出中心视野这些年里,他扎进脑科学领域,砸下十亿美金建立 TCCI,试图挖掘人类大脑的秘密。
公司的另一个创始人则是代季峰,从微软亚洲研究院到商汤科技,一直扎根在计算机视觉领域。他主导过 InternVL 等开源项目,是物体检测与具身智能领域的风云人物。两者组合,让 MiroThinker 1.5 哪怕只是刚上线不久,也得到业内不少关注。

图片来源: MiroMind 正式
不过,如果小模型的性能真的能够与大模型相媲美,Agent 或许将会迎来一轮落地爆发,随着 Agent 真正完成端侧落地,AI 硬件的能力与玩法,或许也会迎来新一轮的变革。
01
梁文锋牵线搭桥,
MiroMind 想要成为下一个 DeepSeek
就在前不久,MiroMind 首席科学家代季峰在知乎上亲自下场,还原了这段颇有江湖色彩的创业故事。
出人意料的是,为 MiroMind 两位核心人物牵线搭桥的正是 DeepSeek 的掌门人梁文锋。
2025 年初,当陈天桥目睹了 DeepSeek 能力后,就意识到通往 AGI 的道路已开始明晰。当发现自己完全有能力打造下一个 DeepSeek 时,他询问梁文锋,谁最适合带队冲刺 AGI?梁文锋当时就推荐了代季峰,陈天桥没有任何迟疑,直接锁定了他,两人联合创办了 MiroMind。
据代季峰回忆道,在创业前最关键的那场谈话中,没有冗长的商务谈判,只有相见恨晚的共鸣。
当时,陈天桥问代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因为梁文锋一人集齐了「有钱、有理想、懂技术」三个要素,沟通与管理的成本降到极限。代老师随后坦诚相待说:「我有理想和技术,但唯独少了点『资金』。」陈天桥对此相视一笑提到,「我有资本,有对 AGI 的执着理想,但确实缺一位懂技术的领路人。」
这种各有所长的组合,补齐了他们通往 AGI 创业道路的最后一块拼图。代季峰在组建团队时,带有一种近乎纯粹的「少年感」,他提到自己不需要那种在大厂下午发消息、深夜十点才带着满身疲惫回家的员工,而是更希望团队伙伴们都能做到「眼里有光」的状态。

图片来源:清华大学正式
在选择究竟以什么方向切入赛道时,代季峰很清醒地意识到,现在 LLM 预训练的曲线已经走到了极其平缓的平台期,作为一个后来者,选择再去大模型赛道拼参数并没有意义。
于是,MiroMind 毅然选择杀入了刚兴起的 Agent Modeling 赛道,他们想看看,如果不再推崇算力至上,而是追求最懂、最实用的模型,能不能在 Agent 时代跑出一条不一样的生路。
02
模型参数量降至 1/30,
成本下降 1/20
过去七个月,MiroMind 一直在思考一个更为根本的问题:智能的「奇点」究竟在哪里?
最后他们给出的的答案并非是「用参数推出世界记忆模型」,而是追求「发现智能」。
他们在正式中写道:真正的智能并非依赖于全知全能,而是依赖于研究、验证和纠正的能力。因为真正的智能不是过目不忘的死记硬背,而是像科学家一样,在不确定性中通过纠错抵达真相。
MiroThinker 1.5 测试的最终的效果,也非常令人欣喜。面对万亿级参数的 Kimi-K2-Thinking,仅有 30B 参数规模的 MiroThinker-v1.5 表现出了相当的推理水平。而最直观的表现是模型性能与模型成本成倒挂的态势,在衡量搜索代理能力的基准测试 BrowseComp-ZH 中,30B 版本的表现位列全球前列。

BrowseComp 基准测试的性能比较 |图片来源:MiroMind 正式
由于参数量缩减到对方的 1/30,MiroThinker 1.5 30B 调用成本大幅下降至每次 0.07 美元,仅为万亿模型成本的 1/20,且推理速度更快。

智能搜索基准测试的性能比较|图片来源:MiroMind 正式
MiroMind 在正式解释了自己的设计思路与原理。他们认为传统的 Scaling Law 路径倾向于将尽可能多的人类知识记忆在模型参数中。这种做法的弊端在于,当模型面对未知领域或实时变动的信息时,往往会基于统计概率「捏造」答案,从而产生幻觉。而 MiroMind 团队则将技术重点放在了交互式缩放(Interactive Scaling)上。
具体而言,在技术实现上,MiroThinker 1.5 引入了几个核心的新机制:
交互式推理闭环:模型不再进行简单的线性思维链(CoT)外推。它构建了一个「提出假设—查询外部数据—发现冲突—修正假设」的研究循环。在得出结论前,模型会主动发起多轮外部检索,利用确定性的外部证据流来抵御不确定的内部推理偏差。
证据驱动的训练机制:在训练阶段,团队改变了奖励函数。系统不再单纯奖励答案的正确性,而是强化模型搜寻证据的行为。缺乏来源支持的高置信度输出会被惩罚,这迫使模型形成一种「先验证、后判断」的本能。
时间敏感型训练沙箱:为了解决 AI 的「后见之明」问题,标准训练中,模型通常能看到数据的最终结果,这使其在预测未来时倾向于先「回忆过去」。简单来说,MiroMind 构建了一个沙箱,严格限制模型只能访问特定时间戳之前的信息,迫使它在信息不完整、存在延迟的真实环境下学习推理和纠错。
如此一来,MiroThinker 1.5 不再是一个试图记住所有百科知识的容器,而是一个擅长使用工具的专业研究员。在处理金融分析、时效性预测等任务时,它能够展示完整的逻辑验证链条。

演示提问:下周有哪些重大事件可能会影响美国纳斯达克指数?|图片来源:MiroMind 正式
03
通往 AGI 的另一种道路
MiroThinker 1.5 的出现,在行业内引发了一定反响。不少业内人士认为,AI 竞争即将从拼参数拼规模的时代,转向「拼智力」的时代。
随着模型参数规模的持续下降和推理成本的边际递减,2026 年小模型或成为关键。当 AI 模型的参数规模最够小、价格最够低,且表现性能足够好时,能够更高效地集成进各类移动终端和边缘设备中,那么 AI 落地硬件的算力门槛问题将会迎刃而解。那些已经在大厂实验室、初创公司里打磨了一两年的 AI 硬件,才算真正具备了底层技术支撑,迎来了真正的「开智」时刻,且能够进一步迎接更丰富的功能,更有趣的交互设计。
就如同电力时代刚开启时,人类必须依赖庞大的变压器和错综复杂的电网供电,那时的电力是昂贵且固定的。但当电池技术成熟、电力变得可随身携带后,电器才真正爆发并改变了每一个人的生活。如今的大模型就像初期的电网中心,而 MiroThinker 1.5 这样的小模型,则更像随处可见的「电池」。
可以预见的是,2026 年,AI 变革将不再仅仅局限于行业内部的技术狂欢,而是会通过手机、眼镜、穿戴设备等每一个真实的硬件入口,触达每一个普通人。当 AI 能够以极低的成本在端侧实时运行、自主研究并解决问题时,所有人都会比以往任何时候,都更直观地感受到 AI 时代对生活的影响。
*头图来源:MiroMind
相关攻略
一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回
雷递网 乐天 3月31日智谱CEO张鹏今日在智谱2025年年报沟通会上表示,智谱曾经历过质疑,经历过挫折,但无数事实反复验证了一个判断——智能上界的提升,是大模型AGI时代唯一的 "第一性 "。张鹏说,
快科技3月31日消息,近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。OpenAI旗下ChatGPT-5 2(Thinki
这项由谷歌智能范式团队联合芝加哥大学、圣塔菲研究所等多家机构完成的突破性研究发表于2026年3月,研究编号为arXiv:2603 20639v1。有兴趣深入了解的读者可以通过这个编号查询完整论文。这
这项由高通AI研究院领导的突破性研究发表于2026年3月的预印本论文,论文编号为arXiv:2603 08462v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究解决了一个让所有AI研究
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





