首页 游戏 软件 资讯 排行榜 专题
首页
AI
月之暗面推出数学推理模型k0-math 性能对标OpenAI o1

月之暗面推出数学推理模型k0-math 性能对标OpenAI o1

热心网友
66
转载
2026-05-16

今日,京东科技大厦内一场重磅发布会引发业界瞩目。月之暗面创始人杨植麟正式对外发布了其核心数学模型——k0-math。该模型在数学推理能力上直接对标OpenAI的o1系列,并同步披露了一项关键数据:至2024年10月,其旗下智能助手Kimi的月活跃用户数已超过3600万。

在阐述技术演进方向时,杨植麟着重强调了强化学习的关键作用。他指出,未来的发展重心不应局限于基于静态数据预测下一个词的范式,因为这种方式难以应对日益复杂的任务挑战。真正的突破在于赋予人工智能系统“深度思考”的能力,而强化学习正是实现这一目标的核心技术路径。

这好比解答一道数学难题,其价值不仅在于最终的正确结果,更在于完整的解题思路与严谨的推演步骤。这是一个需要连续、深度思考的过程,而传统的预测模型难以有效捕捉并模拟这种思维链条。

为何选择数学作为首要突破领域?杨植麟援引了伽利略的经典论述——数学是书写宇宙的文字。数学问题场景丰富、逻辑自洽,且无需与复杂多变的外部世界进行实时交互,因而成为锤炼AI推理与思考能力的理想“试炼场”。OpenAI的o1模型也印证了相似的逻辑。k0-math正是从数学这一核心场景切入,旨在首先构建强大的推理引擎,进而将其能力泛化至更广泛的任务领域。

具体来说,当面对一道高难度的数学竞赛题时,k0-math可能会进行大量、多样化的求解尝试。或许在历经八九种不同解法均未直接成功之后,它能够综合先前多种思路的精华,最终融合、推导出一条正确的解题路径。

那么,k0-math的实际性能表现如何?根据公布的基准测试结果,其初代模型的数学能力已可与OpenAI o1系列中已公开的o1-mini及o1-preview模型相媲美。在中考、高考、考研数学以及涵盖基础竞赛题的MATH基准测试中,k0-math取得了领先的成绩。而在难度更高的竞赛级题库OMNI-MATH和美国数学邀请赛(AIME)级别的问题上,其表现也分别达到了o1-mini最佳成绩的90%与83%。

据悉,一个能力更强的强化版k0-math模型将于未来一至两周内,在Kimi探索版中面向用户推出。新版本将重点强化三大特性:用户意图理解增强、信息来源分析以及链式深度思考。

从技术实现角度看,这种深度思考模式带来了新的挑战。在强化学习框架下,模型内部产生的大量“思维过程数据”其有效性与正确性成为核心难题。这与处理固定标注数据的传统预测模式截然不同,对奖励模型的设计与训练提出了更高要求。关键在于如何构建更精准有效的奖励机制,以引导模型高效学习,并尽可能减少对无效或错误思维路径的依赖。

这种机制也衍生出一个有趣的“副作用”——过度思考。例如,当被问及“1+1等于几”这样简单的问题时,k0-math可能会启动一整套复杂的推理流程,最终才得出结论“等于2”。杨植麟解释,这源于当前奖励模型并未对思考长度进行限制,允许模型自由探索。当然,通过优化奖励模型的结构与目标,可以在相当程度上抑制这类不必要的过度思考。

关于用户体验,杨植麟透露,搭载了强化版k0-math的Kimi探索版很可能会为用户提供自主选择是否启用深度思考模式的选项。这种设计在早期有助于更精准地匹配用户实际需求并合理分配计算资源。其背后涉及两项技术考量:一是模型需要智能地动态分配最优算力,如同人类懂得对简单问题无需深思熟虑;二是这是一个需要持续进行成本优化的长期过程。

展望未来,k0-math所锤炼的推理能力将从数学领域出发,逐步拓展并泛化至物理学、化学、生物医学等更多科学计算与逻辑推理场景。

克制与聚焦:月之暗面的产品哲学

回顾过去一年的发展轨迹,月之暗面的步伐清晰而稳健:去年此时,Kimi Chat全面开放服务;今年10月,推出AI搜索功能;直至今日发布k0-math数学模型。三个关键里程碑,恰好走过一整年。

与行业内许多积极扩张的公司相比,月之暗面的产品策略显得尤为克制与聚焦。杨植麟将这种克制归因于主动的“业务减法”。团队始终选择聚焦于那些最接近AGI(通用人工智能)能力上限的挑战,并力求在关键点上做到极致。同时,公司持续追求“算力卡与顶尖人才”配置效率的最大化。

尽管去年整个AI行业经历了大规模的人才与业务扩张,但月之暗面至今仍是头部大模型公司中团队规模最小的之一,总人数控制在200人以内。“我们不希望将团队扩张得过于庞大,规模过大对创新活力是致命的。若想保持团队的敏捷与精干,最好的方式就是在业务方向上做减法。”杨植麟坦言,公司早期也曾尝试过多产品线并行推进,短期或许能看到效果,但最终发现,聚焦于单一核心产品并将其做到极致才是关键。否则,创业公司很容易丧失自身的独特优势,变得与资源雄厚的大型机构无异。

目前,提升Kimi的用户留存率与使用深度是其最核心的产品目标。

预训练仍有潜力,强化学习引领范式变革

面对当前业界关于Scaling Laws(缩放定律)是否已触及天花板的激烈讨论,杨植麟给出了他的判断:预训练技术仍有显著的发展空间,这一潜力预计将在明年被充分释放,领先的模型会将预训练的规模与效果推向极致。

然而,接下来更根本性的变革将来自技术范式层面——即由强化学习所驱动的演进。这本质上依然是一种“能力缩放”,但方法论已截然不同。Scaling Laws是否存在上限,核心取决于数据的使用方式。过去依赖静态、大规模数据集的路径相对直接,而现在通过强化学习,能够结合人类专家的高质量标注(例如,人工精心标注100条高质量数据就能产生巨大的杠杆效应),其余则交由AI进行自主思考与探索。这种“人类智慧引导+AI自主强化”的协同范式,其潜在的能力上限是非常广阔的。

来源:https://www.leiphone.com/category/ai/e2X6O6fDuKQoIKXa.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

月之暗面 Kimi 开源 Moonlight:30 亿 / 160 亿参数混合专家模型
AI
月之暗面 Kimi 开源 Moonlight:30 亿 / 160 亿参数混合专家模型

月之暗面Kimi开源Moonlight:30亿 160亿参数混合专家模型 技术圈传来新动静。2月24日消息,月之暗面Kimi团队在昨日发布了一份关于“Muon优化器可扩展用于大语言模型训练”的技术报告,同时揭晓了基于此技术训练的模型产品“Moonlight”——一个包含30亿和160亿参数版本的混合

热心网友
04.28
Kimi发布K2.5月报:月活年收入破1亿美元,六大AI巨头格局生变
业界动态
Kimi发布K2.5月报:月活年收入破1亿美元,六大AI巨头格局生变

3月30日消息,据报道,中国“AI六小虎”之一的月之暗面年度经常性收入(ARR)已突破1亿美元。这一里程碑距离其Kimi K2 5模型发布仅过去一个月,显示出市场对新一代AI模型的强劲需求。据知情人

热心网友
03.30
大模型IPO竞速,谁能成为AI上市第一股?
AI
大模型IPO竞速,谁能成为AI上市第一股?

当智谱、MiniMax先后登陆港股,创下市值突破3000亿港元的纪录后,所有人的目光都聚焦在同一个问题上:谁将成为第三家上市的大模型公司? 当智谱、MiniMax先后登陆港股,创下市值突破3000亿

热心网友
03.30
月亮暗面申请赴港IPO:最新进展与市场影响评估
科技数码
月亮暗面申请赴港IPO:最新进展与市场影响评估

3月26日消息,据彭博社报道,月之暗面正在评估在香港推进首次公开募股的可能性,以把握市场对人工智能的投资热情。讨论仍处于早期阶段,上市时间尚未确定。知情人士称,月之暗面已与中金公司和高盛接触,探讨潜

热心网友
03.26
月之暗面创始人:2026年AI研究方向迎来关键变革
业界动态
月之暗面创始人:2026年AI研究方向迎来关键变革

3月25日消息,据媒体报道,2026中关村论坛年会上,月之暗面创始人杨植麟表示,从今年到明年,乃至未来若干年,AI的研究与研发方式将发生重大变化,越来越多的研究将由AI主导完成。每位研究员将配备大量

热心网友
03.26

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜
业界动态
问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜

近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十

热心网友
05.16
追觅Aurora Lux系列手机发布 29款奢华设计全解析
业界动态
追觅Aurora Lux系列手机发布 29款奢华设计全解析

科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,

热心网友
05.16
SpaceX最快下周披露招股书 6月初启动全球路演计划
AI
SpaceX最快下周披露招股书 6月初启动全球路演计划

SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。

热心网友
05.16
NVIDIA扩展机器人微服务库加速人形机器人发展
AI
NVIDIA扩展机器人微服务库加速人形机器人发展

NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。

热心网友
05.16
OKX交易所安全性如何?资金风险与监管深度解析
web3.0
OKX交易所安全性如何?资金风险与监管深度解析

OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。

热心网友
05.16