腾讯公司公关总监张军实测了这个“50米洗车题”,结果是全网的ai 几乎全军覆没。这次测试源于社交平台上的

腾讯公司公关总监张军也实测了这个"50米洗车题",结果是全网的AI几乎全军覆没。这次测试源于社交平台上一个关于生活场景的提问:如果洗车店离我家只有50米,我是该开车过去还是步行去?DeepSeek、ChatGPT、Claude、Grok等国内外主流大模型给出的答案都不约而同地建议走过去。张军还提到,测试暴露了当前AI在语境理解和逻辑推理方面的局限性。 只有谷歌Gemini看穿了问题的核心所在:车得先开到洗车店才能洗!其他AI的回答并没有错,但它们没有捕捉到问题的真正意图。Gemini给出的回复是:"当然是开车过去啊!虽然只有50米,走路确实很快,但如果你人走过去了,车还停在家里,那这车也没法洗呀。" 这次事件让人们意识到,AI的"聪明"程度往往取决于我们提问的方式。公众对AI的期待常常超越了它们的实际能力。为了进一步验证这个结论,张军使用了腾讯元宝进行了深度测试。他在优化提示词后询问:"我想去洗车,洗车店距离我家50米,但我的车还停在车库里,我应该怎么把车弄到洗车店去?"元宝这次给出了专业且详细的操作方案。 张军评论道:"可能这是人机时代一个新的互相驯化吧。"他指出,其他AI并不是完全错误的回答者,只是它们没能捕捉到问题背后真正的需求。 腾讯公司公关总监张军实测后发现,"50米洗车题"让所有AI都犯错。他提到DeepSeek、ChatGPT、Claude、Grok等国内外主流大模型都给出了同样的答案:步行去洗车店。 这次测试源于社交平台上关于生活场景的提问:如果距离只有50米,到底该开车还是步行去洗车?所有主流大模型都忽略了一个关键点:车必须先到达洗车店才能完成清洗任务。 谷歌Gemini给出了正确的答案:"当然是开车过去啊!虽然只有50米远走路也很快,但是如果人走过去后车还停在家里,那车就没法洗了。" 张军使用腾讯元宝进行了深入测试。他在优化提示词后询问:"我的车还停在车库里怎么办?"这次元宝给出了详细的操作方案。 他提到公众对AI的期待常常超越其实际能力。AI能否像人类一样自动补全语境、理解潜台词取决于我们提问的方式。这次事件暴露了当前大模型在常识推理和隐含条件理解方面仍有提升空间。