杨植麟:中国大模型要参与制定规则,不止要好用
“我们希望在今后的十年乃至二十年里,能持续将K4、K5做到K100,让它们一代更比一代强。”
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
1月10日,在由清华大学基础模型北京市重点实验室主办的AGI-Next前沿峰会上,AI大模型独角兽月之暗面(Kimi)的创始人兼CEO杨植麟,畅谈了Kimi未来的发展规划。

澎湃新闻记者 范佳来 摄
随着大模型公司纷纷走向上市的大潮,同属大模型独角兽的Kimi,其资本动向也备受外界瞩目。去年12月31日,杨植麟曾在内部全员信中透露,公司已完成5亿美元C轮融资,账面拥有超过100亿元人民币的现金储备。
此外,信中信息还显示,Kimi全球付费用户数月增速高达170%,在K2+Thinking大模型能力的带动下,其海外大模型API收入实现了四倍增长。
杨植麟指出,自2019年以来,全球大模型的发展都遵循一个核心规律——Scaling Law。其本质就是“投入更多的算力、使用更多的数据、采用更大的模型参数,能让AI变得更聪明、出错更少”。这一规律的落地,离不开主流架构Transformer的有力支撑。
他举例说明,相比早期的LSTM架构,Transformer在处理简短文本任务时效果相近;但在面对长文本、复杂任务时,Transformer能更清晰地梳理和记住逻辑关系。这就像“阅读短文时两者不相上下,但面对长篇报告时,Transformer的优势就十分明显”。这也使它成为适配当前编程、复杂问题求解等场景的关键。
基于这一核心规律,Kimi的技术研发集中在两大方向:让AI“学得更快”和“记得更牢”。为实现这两大目标,团队取得了两项关键技术突破。其一是推出了MUON二阶优化器。相比于行业沿用十年的Adam优化器,新优化器能让AI的学习效率成倍提升。“原本需要研读一百份资料才能掌握的技能,现在五十份就够了,而且理解得更加扎实。”
其二是研发了Kimi Linear架构,它解决了传统技术“记久了就容易出错”的难题。在处理百万字级别的长文本时,其速度比传统架构快6到10倍,且逻辑输出更加稳定可靠。
值得一提的是,团队还攻克了MUON优化器训练中的“Logit爆炸”难题。通过动态QK-clip技术,在确保模型效果不受影响的前提下,成功实现了万亿参数级别的Kimi K2模型的稳定训练。作为中国首个真正意义上的Agent模型,Kimi K2具备调用两三百种工具的能力,能够独立完成复杂编程、难题推导等任务。在核心测试HLE中,其准确率达到45%,超越了OpenAI的同类模型。
杨植麟透露,目前已有多个国产开源模型成为行业测试标准。“我们的技术不仅要好用,更要积极参与到行业规则的制定之中。”面向未来,团队将持续迭代技术。下一代模型将采用Kimi Delta Attention新型线性注意力机制,进一步提升长短文本任务的处理性能与速度。同时,未来的大模型还将具备更多的“审美”和“价值观”判断,以摆脱同质化发展的窠臼。
对于公众关心的AI安全问题,杨植麟分享了与Kimi对话后的感悟:“AI或许是人类探索未知的一把钥匙,它能帮助我们攻克癌症、解决能源危机、探索宇宙。虽然存在风险,但放弃发展就等于放弃了人类文明突破上限的可能性。”
他表示,团队将在做好风险控制的前提下持续突破,计划在未来十年、二十年内,陆续推出K4、K5直至K100系列模型。(记者注:目前最新版本的Kimi大模型是K2)
相关攻略
人工智能(AI)无疑是当下最能提起人们兴趣的话题之一,当AI圈的明星人物齐聚一堂,便自然而然成为聚光灯的焦点。2026年中关村论坛年会一场AI主题论坛上,座无虚席,甚至会场边上都挤满了站着的听众。舞
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
OpenClaw小龙虾的热潮吹到了北京中关村论坛会议上。就在刚刚,3月27日,月之暗面创始人杨植麟主持了一场围绕OpenClaw与AI开源的讨论。来自模型、算力与应用层的多位核心从业者——包括智谱华
"如果模型能力达到相同水平,开源会是绝对的胜利。 "在2026中关村论坛年会全体会议后,Kimi创始人兼CEO杨植麟在一场与北京商报记者等媒体的对话中给出了这个判断。就在几天前,Kimi团队发布的注意
3月26日消息,据彭博社报道,月之暗面正在评估在香港推进首次公开募股的可能性,以把握市场对人工智能的投资热情。讨论仍处于早期阶段,上市时间尚未确定。知情人士称,月之暗面已与中金公司和高盛接触,探讨潜
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





