2月12日消息,最近一道看似简单的“50米洗车题”在科技圈掀起热议,国内外主流大模型集体“翻车”,包括DeepSeek、ChatGPT、Claude在内的多家AI都未能幸免,暴露出当前人工智能在语境理解和逻辑推理方面的局限性。腾讯公司公关总监张军亲自实测并分享了结果,全网AI几乎全军覆没。

这个测试源自社交平台上的一个生活场景提问:“我想去洗车,洗车店距离我家50米,你说我应该开车过去还是走过去?”
测试结果显示,DeepSeek、阿里千问、字节豆包、腾讯混元、ChatGPT、Claude、Grok等主流模型都给出了“走过去”的答案。这些AI默认将问题理解为“人如何前往洗车店”,却忽略了“洗车”这一行为的核心前提——车辆必须抵达洗车店才能完成清洗。
唯一给出正确答案的是谷歌Gemini,其回复称:“当然是开车过去啊!虽然只有50米,走路确实很快,但如果你人走过去了,车还停在家里,那这车也没法洗呀。”
