日前,一款专为编程场景打造的AI模型高速版本已正式上线,面向特定测试计划成员、API开发者及商业用户开放。该高速版本旨在为追求快速代码生成与即时响应的开发者和技术团队,提供更加高效的解决方案。

据官方介绍,高速版与先前发布的Kimi K2.7 Code模型采用相同内核,但在输出速度上实现了质的飞跃。其平均输出速度约为普通版本的5至6倍。在常规编程场景中,以输入长度中位数计算,输出速度可达到约180 Tokens/s。而在短上下文场景下,这一速度更可提升至260 Tokens/s,极大缩短了开发者等待时间。
服务定价与性能提升
伴随着速度的大幅提升,高速版服务的定价也进行了相应调整,其价格为原Kimi K2.7 Code模型的两倍。具体来看,每百万tokens的标准输入和输出价格分别为13元和54元;对于命中了缓存的输入,价格则为2.6元每百万tokens。
模型核心能力与优化
该编程模型于本月初正式发布。根据内外部基准评估结果,相比前代K2.6模型,新版本在多个关键编程能力方面均有明显提升。它显著增强了长上下文编程场景下的指令遵循能力,优化了处理复杂长程编程任务时的性能表现。同时,模型还大幅改善了在长程任务中可能出现的过度思考倾向,使得平均token消耗减少了30%,从而有效提升了资源利用效率。
