健康数据不等于医疗诊断，算法推论不能替代医生的判断

最近，我看到个事儿挺有意思，跟大家聊聊。就是说，那个科技专栏作家杰弗里·A·福勒，他给自己戴了十年的苹果手表，收集了大约2900万步的步数和600万次的心跳数据。他把这些数据都交给了OpenAI的新健康分析功能去评估。结果系统给出了个“F”级评分，说他的心脏健康有问题。这下福勒可吓坏了，赶紧跑去看医生。可医生检查完说，他根本没事，心脏病风险极低。这就很有意思了，专家的数据和医生的诊断完全相反。深入分析这个问题，主要是因为人工智能对数据解读不太科学。福勒发现，系统直接把苹果手表提供的VO2 max当成精确指标来用。但苹果公司明确说了，这个数值只是估算值，只用来帮大家了解运动趋势，不能拿来做临床诊断。还有个问题就是硬件升级。福勒换了新款苹果手表后，静息心率变了。系统没能把设备升级导致的变化跟生理变化分开来看，误以为是健康恶化了。更让人无语的是，系统给出的答案老是变来变去。问同一个问题有时给“F”有时给“B”。有时候还会忘人叫啥、多大岁数。明明拿到了最新的血液报告，分析的时候还是选择性忽略这些信息。这事儿不是个例。现在可穿戴设备越来越多，数据一大堆，AI健康分析工具也越来越多。但这些工具的算法大多是靠公开数据或者聚合信息训练出来的，很难覆盖到每个人的差异、设备误差还有生活情况这些复杂因素。当它们试图越界做诊断时，可靠性就有问题了。专家说了健康数据解读需要医学背景和经验。现在的AI处理数据厉害，但理解背后的生理意义、判断异常值还有综合信息判断方面还比不上医生。如果全交给AI来判断健康问题，可能会让人心里负担重甚至耽误治疗。所以这次事件划出了一条警示线：健康数据不等于医疗诊断，算法推论不能替代医生的判断。以后咱们用这些工具得小心点，别太当真了。未来得建立更好的标准和框架让AI和人一起合作才行。大家也得理性看待这些东西啊！