留子归国任教获清华官网认证据,解读KAN论文价值
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI4
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
爆火神经网络架构KAN一作,毕业新去向已获清华正式认证:
刘子鸣,拟于今年9月加入清华大学人工智能学院,任助理教授。

KAN的初版论文发表于2024年4月,一经发布,即以优于多层感知机(MLP)的准确性和可解释性,成为当时的学术界热议话题。其GitHub仓库,在短短两三天内就收获了1.1k星星。
正如论文中所提到,大家关注的重点在于:
KANs是MLPs的有力替代方案,为进一步改进目前重度依赖MLPs的深度学习模型提供了新的契机。

刘子鸣的这一教职其实早前就已敲定。从他本人在2025年5月发布的招生文章来看,他的首批博士生招生目前已经完成。
KAN一作回国任教
刘子鸣,武汉人,是武钢三中校友。
他从初中起就是竞赛生,高中投身物理竞赛,在2015年以全国第8名的成绩入选物理国家集训队,并被保送至北大物理学院。
本科期间,刘子鸣就关注到了物理学和机器学习的交叉领域,并有一作文章发表在European Physical Journal C、Physical Review C等刊物和NeurIPS 2020等学术会议上。
本科毕业后,刘子鸣赴MIT攻读物理博士学位,师从物理学家Max Tegmark——这位物理学教授最初是一名宇宙学家,后将研究重心转向了人工智能。
KAN正是刘子鸣和Max Tegmark合作的成果。刘子鸣在Max Tegmark指导下,致力于提升神经网络的可解释性,KAN(Kolmogorov-Arnold Networks)的初始灵感,就是想从Kolmogorov-Arnold这个数学定理出发,打开神经网络“黑盒”。
具体来说,Kolmogorov-Arnold定理的核心是:任何定义在有界域上的多元连续函数,都能表示为有限个单变量连续函数的两层嵌套叠加形式。
这为KAN的诞生提供了一个思路:将复杂高维函数学习转化为一组单变量函数的学习。
也就是说,KAN完全无需线性权重:MLP在节点上使用固定激活函数,而KAN则可将学习的激活函数置于边(权重)上,每条边的线性权重被单变量函数替代。

这种设计下,网络中各变量的作用路径都可以被直观地观察到,使得KAN具备MLP无法提供的可解释性和交互性。
论文发布后迅速引发了强烈的反响。Google Scholar显示,到现在,KAN的引用量已经达到3000+。

2024年8月,刘子鸣和合作者们又发表了KAN 2.0,以进一步提高KAN的实用性和易用性。
刘子鸣本人将KAN解读为三个层面的AI+Science:
Science for AI:原理来自于数学;Science of AI:澄清了一些关于Neural Scaling Law的现象;AI for Science:依靠KAN,能够发现科学和工程问题中的符号公式。
而这也正是他的研究方向。

2025年5月份,刘子鸣在社交媒体上更新了自己获得清华教职的消息。在招生文章中,他还说明了自己的研究风格:
1.好奇心驱动(觉得好玩)和影响力驱动(也追热点,但更追求长期影响力)。理想情况,希望研究既有科学上的启发,也能有影响力。比如KAN就是这样的一个例子,我们希望从科学的角度想象AI的更多可能性。
2.理论和实验结合。理论是物理的严格程度,可能会被数学家喷不严谨哈哈。实验更多的是阐释现象,而不是无脑刷SOTA。实验告诉我们什么样的理论可能有用的,而理论指导我们如何去设计实验。
3.研究问题的层次通常介于纯理论和纯应用之间的中间抽象层。抽象的好处是对不同的问题有很强的通用性,但需要抽象本身是高质量的、对实践有用的。所以我会和应用组(具体的科学领域)进行合作,去理解如何进行更好的抽象来贴近应用。
目前,刘子鸣在斯坦福从事博士后研究,合作导师是Andreas Tolias。
One More Thing
说起来,刘子鸣也并没有放下从高中起就投身的物理学。
他现在每天更新的博客,名为“physics of AI”,意为用研究物理学的方式来研究AI,旨在回答:什么样的模型,在什么样的数据上,展现出什么样的现象。
“关键在于‘大量小见解’,而非寄希望于‘少数大发现’。”

△图源:刘子鸣博客
从2025年12月31日起,刘子鸣每天都在更新博客内容,用他自己的话说是:
每天只需投入2小时,我就能通过玩具模型(toy models)了解到关于神经网络的惊人事实。许多见解最终可能微不足道或无关紧要,但其中一些将会产生足以改变领域现状的巨大影响。

参考链接:
[1]https://collegeai.tsinghua.edu.cn/rydw/qzpi/liuziming.htm
[2]https://zhuanlan.zhihu.com/p/1907988943389045778
[3]https://kindxiaoming.github.io/
— 完 —
相关攻略
为纪念谷超豪先生百年诞辰,5月10日将在上海科技馆举办专题科普讲座。李大潜院士将回顾谷超豪从数学少年成长为学科开拓者的历程,展现其科学精神传承。沈维孝院士则以多项式求根为例,引领听众领略数学的深邃与精巧。这是一次与顶尖学者对话、感受数学魅力的难得机会。
当我们开车在高速公路上行驶时,最怕遇到的就是车子突然失控,方向盘变得异常敏感,稍微一动就可能冲出车道。这种情况在人工智能的训练过程中也经常发生,特别是在训练那些能够进行推理和对话的大型语言模型时。来
这项由威斯康星大学麦迪逊分校研究团队完成的突破性研究,发表于2026年3月的《机器学习》期刊,论文编号为arXiv:2603 20538v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究
这项由高通AI研究院领导的突破性研究发表于2026年3月的预印本论文,论文编号为arXiv:2603 08462v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究解决了一个让所有AI研究
3月31日消息,近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。OpenAI旗下ChatGPT-5 2(Thinking)
热门专题
热门推荐
据传REDMI正研发一款配备7英寸2K大屏与超10000mAh电池的手机。该产品旨在融合巨屏显示与超长续航,兼顾通信、支付等基础功能,并拓展至办公、阅读、影音等多场景应用,试图在便携与实用间寻求新平衡。此举或填补高端安卓大屏市场空白,重新定义巨屏手机体验。
河南省科学院召开“十五五”规划咨询会,18位两院院士线上线下共商发展蓝图。会议总结“十四五”在机制、人才、平台及成果等方面成效,明确未来五年将聚焦特色领域、深化科产融合、加强人才培养与重大设施建设,致力建成全国一流新型研发机构,支撑区域创新发展。
科学家唐立梅兼具深海与极地科考经历,近期转型短视频科普。她发现严谨表达未必受欢迎,情感共鸣内容反而更易引发关注,流量规律令其困惑。尽管难以把握算法,她仍坚持每条视频必须承载扎实的科普价值,并依靠年轻团队适应传播环境。
知情人士透露,虎鲸文娱旗下AI写真应用妙鸭相机核心团队已于去年9月底解散。该产品去年7月上线后曾迅速走红,用户支付9 9元即可生成数字分身制作写真。目前产品已停止更新与推广,仅维持基础运营。其从爆红到解散的短暂历程,为AI应用的商业可持续性提供了反思案例。
特斯拉在柏林工厂内部使用自动驾驶系统完成约15万公里短途转运,替代人工挪车。闭环测试环境提升了生产效率和空间利用率,展现了人工智能在工业流程中的实际应用。





