IT之家1月27日消息,《华盛顿邮报》科技专栏作家杰弗里·A·福勒日前对OpenAI最新上线的ChatGPT健康评估功能进行了测试。他导入了自己十年来累积的Apple Watch健康数据,其中包括超过2900万条步数记录和600万次心率测量,结果却被AI错误地判定为心脏健康“不合格”。

这一结果让福勒感到十分不安,他立即联系了自己的医生。医生在详细检查了他的身体状况后,明确否定了AI的诊断。医生指出,福勒的心脏病发作风险极低,甚至无需进行额外的有氧适能测试来验证AI的结论。
深入分析显示,ChatGPT此次误判主要源于对数据性质的误读。福勒解释道,AI将Apple Watch记录的最大摄氧量数据,视为精准无误的医疗诊断依据,并据此给出了负面评价。然而实际上,苹果公司早已明确说明,该数据仅为“估算值”,其主要用途在于追踪用户的长期健康趋势,而非用于临床诊断。
此外,福勒还发现,当他更换新款Apple Watch后,由于传感器升级导致的静息心率基准值变化,也被AI错误地解读为其生理机能发生了实质性改变。AI完全忽视了硬件迭代这一关键变量。


除了数据误读,ChatGPT健康功能的反馈结果还存在不稳定的情况。当福勒就同一个健康问题重复询问时,AI给出的评分竟在“不合格”到“良好”之间剧烈摇摆。IT之家附上相关截图如下:

更为严重的是,该系统还表现出明显的“健忘症”和逻辑断层。在对话过程中,它多次遗忘用户的性别、年龄等基础信息。甚至在用户已提供近期血液检测报告的情况下,AI在分析时却选择性地忽略了这些关键的临床证据。
