当前AI大模型竞争日趋激烈,模型的实际响应速度正逐渐成为影响开发者工作效率与终端用户体验的核心指标。继上周推出Kimi 2.7 Code大模型之后,月之暗面公司近日正式发布了该模型的高速版本,其内容输出速度达到常规版的6倍,显著提升了编程开发场景下的生产力。

对开发者而言,大模型的响应速度直接关系到代码生成、调试流程以及项目整体推进的效率。本次推出的Kimi K2.7 Code高速版,正是针对这一核心痛点进行了专项优化。官方明确表示,高速版与普通版基于同一基础模型,但通过多项技术层面的改进实现了输出速度的跨越式提升。
速度与性能的具体表现
根据官方公布的数据,在常规编程场景下,以输入长度的中位数来衡量,Kimi K2.7 Code高速版的输出速度约为180 Token/s。而在短上下文场景中,其输出速度更是可以达到260 Token/s。这意味着在相同的任务处理时长内,开发者能够获得更多的代码输出量或更迅速的响应反馈,从而大幅减少等待时间,优化整体工作流体验。
接入方式与定价策略
开发者与企业用户均可通过Kimi API开放平台调用该高速版模型,对应的模型ID为kimi-k2.7-code-highspeed。在定价方面,高速版API的定价为普通版的2倍。对于已订阅Kimi Code Plan的用户,则可加入“抢先体验计划”,直接在Kimi Code环境中使用Kimi K2.7 Code高速版。需要特别注意的是,在该计划中,6倍速高速版模型的用量消耗按普通版模型的3倍计算。
月之暗面公司同时公布了后续的开放规划:在算力资源进一步完成扩容后,预计自7月起,Kimi将逐步把高速版模型的体验权限开放给Allegretto及以上级别的会员。这表明该公司正在有计划地将高性能模型推向更广泛的用户群体。
使用注意事项与性能保障
为了充分发挥Kimi K2.7 Code系列模型的最佳性能,用户必须开启思考模式(Thinking)。在Kimi API和Kimi Code环境中,思考模式默认处于开启状态。如果用户手动关闭了思考模式,API调用将触发报错,而在Kimi Code环境中则会自动回退到性能稍逊的K2.6模型。这一设定确保了高速版模型始终在预设的最优配置下稳定运行。
前沿智能应该更开放、响应更快、全球通用,而非成为一种特权。
月之暗面在发布说明中特别强调了开放与普惠的核心理念。这一表态也被业界解读为对当前全球AI技术发展格局的一种积极回应——尤其是在部分国家采取技术限制措施的背景下,倡导技术的开放与共享更具现实意义。
