健康数据不等于医疗诊断,算法推论不能替代医生的判断

最近,我看到个事儿挺有意思,跟大家聊聊。就是说,那个科技专栏作家杰弗里·A·福勒,他给自己戴了十年的苹果手表,收集了大约2900万步的步数和600万次的心跳数据。他把这些数据都交给了OpenAI的新健康分析功能去评估。结果系统给出了个“F”级评分,说他的心脏健康有问题。这下福勒可吓坏了,赶紧跑去看医生。可医生检查完说,他根本没事,心脏病风险极低。这就很有意思了,专家的数据和医生的诊断完全相反。 深入分析这个问题,主要是因为人工智能对数据解读不太科学。福勒发现,系统直接把苹果手表提供的VO2 max当成精确指标来用。但苹果公司明确说了,这个数值只是估算值,只用来帮大家了解运动趋势,不能拿来做临床诊断。还有个问题就是硬件升级。福勒换了新款苹果手表后,静息心率变了。系统没能把设备升级导致的变化跟生理变化分开来看,误以为是健康恶化了。 更让人无语的是,系统给出的答案老是变来变去。问同一个问题有时给“F”有时给“B”。有时候还会忘人叫啥、多大岁数。明明拿到了最新的血液报告,分析的时候还是选择性忽略这些信息。 这事儿不是个例。现在可穿戴设备越来越多,数据一大堆,AI健康分析工具也越来越多。但这些工具的算法大多是靠公开数据或者聚合信息训练出来的,很难覆盖到每个人的差异、设备误差还有生活情况这些复杂因素。当它们试图越界做诊断时,可靠性就有问题了。 专家说了健康数据解读需要医学背景和经验。现在的AI处理数据厉害,但理解背后的生理意义、判断异常值还有综合信息判断方面还比不上医生。如果全交给AI来判断健康问题,可能会让人心里负担重甚至耽误治疗。 所以这次事件划出了一条警示线:健康数据不等于医疗诊断,算法推论不能替代医生的判断。以后咱们用这些工具得小心点,别太当真了。未来得建立更好的标准和框架让AI和人一起合作才行。大家也得理性看待这些东西啊!