Kimi负责人谈国产大模型上亚马逊云挑战海外巨头_AI热点日报

Kimi负责人谈国产大模型上亚马逊云挑战海外巨头

类型：热点整理2026-07-04

月之暗面Kimi与亚马逊云科技达成四层合作，借助全球基础设施扩展业务。B端业务比重增加，提供模型、API及产品。技术创新包括Muon优化器、Linear架构和Agent集群，旨在探索智能上限，与海外头部模型竞争。

在2026亚马逊云科技中国峰会上，月之暗面Kimi的B端负责人黄震昕分享了与亚马逊云科技的合作细节。他透露了一个关键信息：Kimi为其研发团队提供了行业内领先的人均算力配置，同时C端和B端业务在今年均呈现出快速增长的态势。他们的目标十分明确——希望在探索智能上限的征途中，与海外那三大模型展开正面竞争。

这次合作有一个非常贴切的比喻——飞轮效应。月之暗面既依赖亚马逊云科技的全球云基础设施，又依托亚马逊云科技的渠道将自身服务拓展至全球企业。黄震昕的原话是：“亚马逊云科技的品牌影响力和合规能力在海外市场表现非常出色，我们也希望通过这次合作，推动收入实现更快的增长曲线。”

一、四层合作，实现全球协同效应

月之暗面与亚马逊云科技的合作，并非仅限于单点对接，而是从基础设施层一直延伸至应用层。具体来看：

1、基础设施层

Kimi直接利用亚马逊云科技遍布全球的数据中心和网络基础设施来扩展业务规模。这意味着什么？稳定可靠的算力资源，能确保模型运行得既快又稳——这对于大模型而言，是最基本也是最核心的要求。

2、平台服务层

Kimi的多个模型已在Amazon SageMaker上部署，开发者可以直接在此平台上进行训练和推理，显著降低了使用门槛。同时，Amazon Bedrock已接入K2.5等开源模型，Kimi也在积极推动更多新款模型的上线。这样一来，用户无需自行管理基础设施或单独部署服务器，即可直接调用Kimi的能力。更直白地说：Kimi使用自身的算力，运行在亚马逊云科技的Gateway网关上，为亚马逊云科技的客户提供推理服务。

3、业务合作层

Kimi的官方API已成功上线AWS Marketplace，借此直接触达全球数百万活跃企业客户。全球客户通过这一数字化软件商城，能够简化采购流程，实现一键使用、按量付费、零门槛接入。

黄震昕透露了一个有意思的细节：当前全球大模型市场仍面临硬件供不应求的局面，因此Kimi会设有一定的TPM限制，并对渠道供给做出相应侧重。但对于新上线的AWS Marketplace渠道，Kimi会给予重点资源倾斜，保障其拥有充足且稳定的TPM供应。此外，通过APN合作伙伴网络，Kimi正在快速拓展企业客户群体。

4、垂直行业层

Kimi与亚马逊云科技的解决方案架构师团队携手，联合打造行业级解决方案，覆盖金融、医疗、制造等垂直场景。合作逻辑十分清晰：Kimi提供核心大模型能力，亚马逊云科技发挥行业经验与客户资源优势，共同将Kimi的能力无缝嵌入企业真实业务流程之中。

二、B端业务比重增加，提供模型、API和产品

月之暗面于2023年3月成立，自创立之初便将自身定位为全球化公司。黄震昕强调，他们的业务重心聚焦于生产力场景，不涉足娱乐领域。其愿景宏大：寻找从能源高效转化为智能的最优解，探索智能上限的实现路径。

目前，B端业务占比持续提升。面向企业级客户，Kimi依托亚马逊云科技的技术底座与全球基础设施，构建了一套完整的生产力赋能体系，涵盖以下三个层面：

模型层：K2.7 Code、K2.6、K2.5等基础模型
服务层：丰富的API接口，支持深度集成
工具/产品层：Kimi Agent集群、Kimi Code、Kimi Claw、Kimi Work等即开即用的产品

黄震昕补充说，Kimi将视觉理解、Coding和Agent能力整合于一个模型之中，在预训练阶段便将视觉数据与文本数据放在一起训练，使模型具备更广泛的适配性。举例来说，Visual-to-Code功能可以将视觉动效直接用代码实现出来。近期与字节跳动Trae合作推出的Visual Debug功能，允许程序员通过录屏或截图标注bug，模型能够快速进行修复。

许多程序员习惯直接发送一张图或录屏，让模型进行调试。Kimi在这类“图片+Coding”的混合场景中，确实拥有明显的技术领先优势。

不过，企业客户在实际落地时仍需要最后一公里的服务。因此，Kimi也在积极部署FDE合作伙伴，以便在模型基础上为客户提供端到端的交付服务。

三、预测大模型服务价格趋势，拆解智能体三大技术创新

谈及近期大模型服务价格的波动，黄震昕给出了两个判断。

首先，今年模型普遍涨价的核心原因，是全球范围内算力成本的持续上涨，增长速度跟不上Token需求的爆发。但他也指出：用户对于最高性能的Token，是愿意支付溢价的。

其次，尽管芯片供应紧张和算力成本上升导致成本增加，但模型厂商也在通过Cache优化、推理优化等技术手段，努力拉低Token的实际成本。因此，在当前阶段，成本压力与技术优化“两股力量在同时发挥作用”。

黄震昕的态度很明确：“只要能够为客户提供性价比更高、性能更强的模型，即便价格有所波动，客户的整体使用体验和性价比实际上是在大幅提升的。”Kimi的目标是打造最高性能的模型，而非追求最低价格，但同时也希望为终端用户提升性价比，降低使用门槛。

月之暗面团队非常精简，仅有300多人。他们不仅在模型效率上持续优化，还专注于底层创新，致力于解决Scaling Law中的关键瓶颈。

在技术创新方面，Kimi围绕智能体的三个核心维度进行布局，并已取得显著成果：

（1）Token效率：2025年，Kimi首次大规模应用Muon二阶优化器，成功让10T的训练数据发挥出20T的效果，Token效率直接翻倍。这一技术已被GLM、DeepSeek V4等模型所采用。

（2）长程推理：发布Kimi Linear架构，当模型规模扩大10倍时，原本会导致Token成本膨胀100倍的指数级增长，被成功压缩为线性的10倍增长。这对于降低长链路推理成本具有重大意义。

（3）Agent集群：支持300个子Agent并行完成4000个协作步骤，实现了更大规模的并行化，进一步推高了多Agent系统协作能力的上限。

此外，Kimi还通过持续的工程效率优化来实现降本增效。

在降本方面，自研的KVCache中心化解耦架构Mooncake，将Cache命中率提升至92.5%，使K2.7-code模型的有效输入价格降低了74%。

在提效方面，高速版K2.7-code-highspeed的输出速度约为180 tokens/s，在短上下文场景下可达260 tokens/s，实现了“十几秒输出200行代码”的高效表现。

黄震昕建议，评估模型价格时不能只看输入输出成本，更应该关注Cache命中率。命中率在90%以上与70%-80%相比，实际成本可能相差数倍。

他透露，Kimi与亚马逊云科技已经开始在推理优化方面展开合作，双方共同探讨如何将原厂在底层推理优化上的能力共享给合作伙伴，由双方协同优化。目标是在最终上线时，双方提供给客户的Cache命中率、推理性能等指标能够处于同一高水平线上。

此外，Kimi还找到了多种技术手段来解决服务稳定性方面的问题。

结语：基模厂商应看向更底层的前沿技术

“在探索Scaling Law的道路上，Kimi选择直接向底层模型架构发起挑战。因为我们深知，只有实现底层架构的创新突破，才能真正承载更大的模型规模，推动Scaling Law持续向前，从而探索智能的上限。”黄震昕说道。

2026年初，Kimi开源了“注意力残差”技术，为下一代大模型架构设计提供了全新思路。OpenAI推理之父Jerry Tworek对此点评：“我们应该重新思考一切，深度学习的2.0时代正在到来。”

总而言之，基模厂商不能只盯着现有的Harness，必须向更底层的前沿技术看齐。这才是真正的竞争壁垒所在。

来源：https://www.zhidx.com/p/572574.html

亚马逊

延伸阅读

补充最近整理过的热点入口。