11月8日有消息显示,在AI大模型这个赛道,美国公司大多选择封闭发展路线,投入资金巨大;而国产大模型则普遍拥抱开源策略。此前DeepSeek、Qwen等模型各有建树,如今月之暗面推出的Kimi K2Thinking再次展现出王者风范。
作为K2家族中的思维大模型,Kimi K2Thinking在多项基准测试中达到了SOTA水平,部分指标甚至超越了GPT-5。同时在智能体搜索、智能体编程、文本创作和综合推理等核心能力上也实现了全面提升。
发布仅两天时间,Kimi K2Thinking就登顶HuggingFace抱抱脸榜单。国外用户纷纷给予好评,顺便还吐槽了OpenAI等公司封闭模型存在的局限性。

在被誉为“人类终极测试”的HLE超高难度基准上,Kimi K2 Thinking取得了44.9%的得分,超过了Grok4、GPT-5、Claude 4.5等先进模型。若是Kimi K2 Thinking Heavy版本,分数更是能够进一步提升到51%。
对此HuggingFace联合创始人Thomas Wolf也发表了对Kimi K2 Thinking的评价,称我们正在见证又一个DeepSeek时刻——开源软件再次超越了闭源软件。他不禁发问:今后是不是每隔几个月就会出现这样的情况?
然而Kimi K2Thinking令人惊艳的地方不仅在于能力强大,更关键的是成本优势明显。其API定价为每百万token输入0.15美元(缓存命中)/0.6美元(缓存未命中),每百万token输出2.5美元,相比GPT-5的价格(每百万token输入1.25美元、输出10美元)低了一个数量级。
能够实现如此低的成本,与其训练成本大幅下降密切相关。据知情人士透露,Kimi K2 Thinking的训练成本仅为460万美元,要知道此前的成本标杆DeepSeek V3模型也花费了560万美元,现在成本又降低了至少10%。
如果与国外的大模型对比,那就更不在一个量级了。OpenAI的GPT-3花费了数十亿美元,谷歌、微软、XAI等公司的大模型同样是通过巨额投入打造而成,仅仅是GPU费用就远超国内公司的投入水平。

