Kimi回应马斯克点赞:火箭评价背后的AI技术亮点
3月17日,Kimi官方账号对马斯克点赞其最新成果一事作出回应,幽默地表示“你的火箭造得也挺棒”。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈


据报道,Kimi团队近日发布了一项技术报告,提出全新的Attention Residuals机制。该机制对深度学习领域沿用近十年的传统残差连接实现了颠覆性重构,迅速引发了全球范围的关注。
传统残差连接以“固定等权累加”的方式传递信息,随着模型层数增加,容易导致浅层信息被稀释、训练效率降低以及模型稳定性变差等问题。
而Kimi的创新相当于为AI模型装上了“智能筛选器”,它将Transformer注意力机制迁移到模型深度维度,让每一层都能动态筛选此前有用的信息、抑制冗余,从而显著提升信息传递的效率。

实测数据显示,采用该机制的48B参数模型训练效率提升了1.25倍,在科学推理和数学解题任务上的成绩分别提高了7.5%和3.6%,有效解决了传统模型训练中的不平衡问题。
一向以挑剔著称的马斯克转发并评论了这项研究,称“Kimi的工作令人印象深刻”。其旗下的xAI目前正处于重组期,此次公开认可足以体现该技术的分量。
相关攻略
IT之家 4 月 1 日消息,谷歌 DeepMind 昨日推出 Veo 3 1 Lite 视频模型,是该公司迄今为止最实惠的视频生成工具。最新数据显示,Lite 版的生成速度和 Fast 版本保持一
今天傍晚,DeepSeek再度出现服务异常,社交平台上不少用户反馈,对话过程中频繁遭遇“请检查网络后重试”或“服务器繁忙”等提示。目前,服务已恢复正常。这是三天之内DeepSeek第二次发生服务故障
3月29日晚至30日上午,在经历长达12小时的宕机后,DeepSeek“崩”上热搜。大量用户反映网页端和App提示“服务器繁忙”或无法响应,据了解,这是DeepSeek有史以来最长的一次“罢工”。而
IT之家 3 月 31 日消息,小米创办人、董事长兼 CEO 雷军今日分享了 MiMo-V2-Pro 大模型最新“战绩”。在大模型权威评测榜单 Text Arena,MiMo-V2-Pro 凭借在复
3月31日,苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版,需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig
热门专题
热门推荐
三星电子计划在2030年前开发基于 forksheet 结构的 1nm SF1 0 工艺 近日,半导体制造领域传出重要技术进展。据《韩国经济日报》3月31日援引行业内部人士消息,三星电子晶圆代工厂已经制定了一项直至2030年的详细技术路线图。该计划的核心目标是,在2030年之前完成1纳米(1nm)级
4月1日消息,OPPO于今日在线上正式发布了新一代机型K15 Pro。该系列手机最受瞩目的核心卖点在于全系搭载了性能强劲的疾风散热引擎,通过主动散热技术大幅提升了手机在高负载状态下的性能表现。为了从
4月1日消息,为了有效应对全球存储市场的短缺危机,韩国两大芯片巨头三星电子与SK海力士不约而同地选择了加大对中国工厂的投入。据韩国媒体最新披露,这两大巨头已确定在2025年继续扩大在华投资规模。这一
4月1日消息,4月1日,界面新闻独家获悉,原特斯拉中国区总经理孔艳双已入职小米,将接替原小米汽车总监李晓锐负责汽车销售方面工作。孔艳双于3月初入职,处于工作交接期,目前小米内部并未正式发文通告其正式
笔记本电脑电池不耐用?酷睿 Ultra 三代轻薄本彻底解决续航难题 移动办公时,笔记本电脑续航时间短是许多用户的核心痛点。如今,搭载新一代处理器的轻薄本带来了突破性解决方案:华硕无畏 Pro16 2026 酷睿版。这款产品内置英特尔酷睿 Ultra7 356H 处理器,并配备高达 80Wh 的大容量





