杨植麟:中国大模型要参与制定规则,不止要好用
“我们希望在今后的十年乃至二十年里,能持续将K4、K5做到K100,让它们一代更比一代强。”
1月10日,在由清华大学基础模型北京市重点实验室主办的AGI-Next前沿峰会上,AI大模型独角兽月之暗面(Kimi)的创始人兼CEO杨植麟,畅谈了Kimi未来的发展规划。

澎湃新闻记者 范佳来 摄
随着大模型公司纷纷走向上市的大潮,同属大模型独角兽的Kimi,其资本动向也备受外界瞩目。去年12月31日,杨植麟曾在内部全员信中透露,公司已完成5亿美元C轮融资,账面拥有超过100亿元人民币的现金储备。
此外,信中信息还显示,Kimi全球付费用户数月增速高达170%,在K2+Thinking大模型能力的带动下,其海外大模型API收入实现了四倍增长。
杨植麟指出,自2019年以来,全球大模型的发展都遵循一个核心规律——Scaling Law。其本质就是“投入更多的算力、使用更多的数据、采用更大的模型参数,能让AI变得更聪明、出错更少”。这一规律的落地,离不开主流架构Transformer的有力支撑。
他举例说明,相比早期的LSTM架构,Transformer在处理简短文本任务时效果相近;但在面对长文本、复杂任务时,Transformer能更清晰地梳理和记住逻辑关系。这就像“阅读短文时两者不相上下,但面对长篇报告时,Transformer的优势就十分明显”。这也使它成为适配当前编程、复杂问题求解等场景的关键。
基于这一核心规律,Kimi的技术研发集中在两大方向:让AI“学得更快”和“记得更牢”。为实现这两大目标,团队取得了两项关键技术突破。其一是推出了MUON二阶优化器。相比于行业沿用十年的Adam优化器,新优化器能让AI的学习效率成倍提升。“原本需要研读一百份资料才能掌握的技能,现在五十份就够了,而且理解得更加扎实。”
其二是研发了Kimi Linear架构,它解决了传统技术“记久了就容易出错”的难题。在处理百万字级别的长文本时,其速度比传统架构快6到10倍,且逻辑输出更加稳定可靠。
值得一提的是,团队还攻克了MUON优化器训练中的“Logit爆炸”难题。通过动态QK-clip技术,在确保模型效果不受影响的前提下,成功实现了万亿参数级别的Kimi K2模型的稳定训练。作为中国首个真正意义上的Agent模型,Kimi K2具备调用两三百种工具的能力,能够独立完成复杂编程、难题推导等任务。在核心测试HLE中,其准确率达到45%,超越了OpenAI的同类模型。
杨植麟透露,目前已有多个国产开源模型成为行业测试标准。“我们的技术不仅要好用,更要积极参与到行业规则的制定之中。”面向未来,团队将持续迭代技术。下一代模型将采用Kimi Delta Attention新型线性注意力机制,进一步提升长短文本任务的处理性能与速度。同时,未来的大模型还将具备更多的“审美”和“价值观”判断,以摆脱同质化发展的窠臼。
对于公众关心的AI安全问题,杨植麟分享了与Kimi对话后的感悟:“AI或许是人类探索未知的一把钥匙,它能帮助我们攻克癌症、解决能源危机、探索宇宙。虽然存在风险,但放弃发展就等于放弃了人类文明突破上限的可能性。”
他表示,团队将在做好风险控制的前提下持续突破,计划在未来十年、二十年内,陆续推出K4、K5直至K100系列模型。(记者注:目前最新版本的Kimi大模型是K2)
相关攻略
人工智能(AI)无疑是当下最能提起人们兴趣的话题之一,当AI圈的明星人物齐聚一堂,便自然而然成为聚光灯的焦点。2026年中关村论坛年会一场AI主题论坛上,座无虚席,甚至会场边上都挤满了站着的听众。舞
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
OpenClaw小龙虾的热潮吹到了北京中关村论坛会议上。就在刚刚,3月27日,月之暗面创始人杨植麟主持了一场围绕OpenClaw与AI开源的讨论。来自模型、算力与应用层的多位核心从业者——包括智谱华
"如果模型能力达到相同水平,开源会是绝对的胜利。 "在2026中关村论坛年会全体会议后,Kimi创始人兼CEO杨植麟在一场与北京商报记者等媒体的对话中给出了这个判断。就在几天前,Kimi团队发布的注意
3月26日消息,据彭博社报道,月之暗面正在评估在香港推进首次公开募股的可能性,以把握市场对人工智能的投资热情。讨论仍处于早期阶段,上市时间尚未确定。知情人士称,月之暗面已与中金公司和高盛接触,探讨潜
热门专题
热门推荐
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练





