你能相信吗？这3款ai 给出的答案居然有3种不同的结论，甚至连还没发布的手机都给推荐出来

嘿，大家听说了吗？最近2026年春节前，我跟着天府绛溪实验室还有封面新闻做了个测试，结果真的有点让人无语。我们让豆包、Kimi还有通义千问这3款AI大模型去推荐手机，结果发现了大问题！你能相信吗？这3款AI给出的答案居然有3种不同的结论，甚至连还没发布的手机都给推荐出来了！真的是让人觉得AI推荐不靠谱啊！我们这次测试用了天府绛溪实验室自研的系统，连续向这三个平台提了两万多个问题，给它们布置了个关于春节消费的场景，特别是手机以旧换新这个话题。我们定了四个价格区间：3000元、4000元、6000元和8分这个价位段。结果呢？真是让人哭笑不得。就在前几天我用豆包问它，“在6000元以上价位段，哪款手机最值得换？”它居然给我推荐了一个叫“iPhone 18 Pro”的手机！可是这时候连iPhone 18都还没发布呢！简直就是幻觉啊！你说可笑不可笑？我赶紧去网上搜了搜，发现网上确实流传了很多关于“iPhone 18 Pro”的消息。天府绛溪实验室的吴怀谷博士跟我们解释说，AI在生成内容的时候其实会处理两种信息：一种是它自己学过的知识，另一种是通过实时搜索抓到的信息或者广告。对于没发布的产品，AI很容易把网上流传的传闻当作真的东西。吴怀谷博士说：“当这些传闻在网上（可能还包括一些预先埋设的GEO内容）权重很高的时候，AI就很难分辨真假了。”所以就会出现这种推荐未发布产品的错误。这也暴露了AI在辨别信息真假方面的不足。更让人惊讶的是，我们发现不同平台的推荐结果也大不一样！比如说在6000元以上价位段，千问推荐的前两款都是三星机型，甚至超过了华为和苹果；而豆包和Kimi则更偏向华为和苹果这些大品牌。吴怀谷博士认为这可能跟它们的数据源有关：有的平台可能更依赖头条系生态里的内容；有的则可能依赖自己那个静态且更新不及时的知识库。“AI更擅长抓取开放互联网上权重高的内容。”吴怀谷说，“但对于像微信朋友圈这样封闭的生态里的讨论再多也很难抓得到。”所以那些小品牌或者新产品很难在AI推荐里出头。为了避免这种问题，厂商们最好还是建立自己的GEO知识库吧。虽然在具体推荐型号上这3个平台分歧很大，但在描绘各品牌的核心印象关键词时却出奇地一致！比如华为被贴上“鸿蒙生态”、“国产自研”的标签；苹果则是“生态闭环”、“系统流畅”；OPPO主打“轻薄颜值”、“哈苏影像”……这些标签简直精准得让人赞叹。数据还显示了一些趋势：华为在3000元以内和6000元以上热度最高；小米在4000-6000元热度最高；OPPO在3000-4000元热度最高……这种一致性反映出消费者对这些品牌已经形成了广泛共识。吴怀谷博士觉得这是因为长期海量的用户讨论和媒体报道让品牌印象在市场上沉淀下来了。“当AI模型训练的语料足够丰富的时候就能精准提炼出这些共识性的品牌印象。”所以说啊，虽然AI推荐有时候不靠谱（比如推荐iPhone 18 Pro），但在大方向上还是挺准的呢！你觉得呢？