第22章
医疗决策,用科学的诊断指南减少噪声
几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。
这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降,仍然很高。对于下一步的治疗方案,琼斯医生感到很苦恼,保罗也很焦虑,毕竟他年纪不算大,身体也一向健康。随后,琼斯医生寻思着尝试第三种药物。
就在这时,保罗搬到了一座新城市,在那里他咨询了另一位名叫史密斯的医生。保罗向史密斯讲述了他这些日子与高血压抗争的经历。史密斯立即回答说:“买一台家用血压计,在家测测看血压值是多少。我认为你根本没有高血压。你可能只是得了‘白大褂综合征’——一进医生办公室,血压就升高!”
保罗照办了,果然,他在家时测得的血压是正常的,而且从那以第22章
医疗决策,用科学的诊断指南减少噪声
几年前,我们的一位好朋友保罗被他的主治医师琼斯诊断为患有高血压。琼斯医生建议保罗尝试药物治疗,他给保罗开了利尿剂,但保罗的血压依旧很高,也就是说药物没起到效果。几个星期后,琼斯又开了第二种药物——钙通道阻滞剂,但效果依然不理想。
这些结果使琼斯困惑不已。虽然过去的3个月保罗每星期都会来复诊,但他的血压只是略有下降,仍然很高。对于下一步的治疗方案,琼斯医生感到很苦恼,保罗也很焦虑,毕竟他年纪不算大,身体也一向健康。随后,琼斯医生寻思着尝试第三种药物。
就在这时,保罗搬到了一座新城市,在那里他咨询了另一位名叫史密斯的医生。保罗向史密斯讲述了他这些日子与高血压抗争的经历。史密斯立即回答说:“买一台家用血压计,在家测测看血压值是多少。我认为你根本没有高血压。你可能只是得了‘白大褂综合征’——一进医生办公室,血压就升高!”
保罗照办了,果然,他在家时测得的血压是正常的,而且从那以后一直很正常。在史密斯医生向保罗说了“白大褂综合征”这件事的一个月后,即便是在医生的办公室,保罗的血压也没有再高过。
医生的主要任务就是做出诊断——判断病人是否患病了,如果患病了,还要鉴定出是哪种疾病。在许多情况下,诊断是常规化的,甚至是机械化的,并且人们还制定了规则和程序以减少噪声。医生通常很容易判断某个人的肩膀有没有脱臼或脚趾有没有骨折,而在一些对技术性要求更高的问题上,医生也能比较容易地做出判断。比如,量化肌腱退化的程度时,医生的诊断产生的噪声就很小。当病理学家评估乳腺病灶的穿刺活检结果时,他们的评估是比较明确的,几乎没有噪声。
然而,有些诊断根本不涉及判断。医疗水平的进步往往是通过消除判断也就是将判断转变为计算来实现的。对于链球菌性咽喉炎的诊断,医生首先要对患者的咽拭子标本进行快速抗原检测,这种检测可以很快检测出患者是否出现链球菌感染。可以说,即便有这种快速抗原检测结果,链球菌性咽喉炎的诊断也存在噪声,但如果没有,那情况将更糟。如果你的空腹血糖水平为126mg/dL或更高,或是糖化血红蛋白(过去3个月内血糖的平均值)高于6.5HbAlc,你就会被诊断为患有糖尿病。在新型冠状病毒疫情出现的早期阶段,一些医生做初步诊断时是根据症状做出判断的,随着疫情的发展,检验变得越来越普遍,有了检验结果,判断就没有必要了。
当医生做判断时,他们的判断可能会有噪声,而且可能会出错,标准做法是建议患者再咨询另外一位医生,获取第二诊疗意见。在有些医院里,第二诊疗意见是必须给出的。当第二诊疗意见与首诊意见后一直很正常。在史密斯医生向保罗说了“白大褂综合征”这件事的一个月后,即便是在医生的办公室,保罗的血压也没有再高过。
医生的主要任务就是做出诊断——判断病人是否患病了,如果患病了,还要鉴定出是哪种疾病。在许多情况下,诊断是常规化的,甚至是机械化的,并且人们还制定了规则和程序以减少噪声。医生通常很容易判断某个人的肩膀有没有脱臼或脚趾有没有骨折,而在一些对技术性要求更高的问题上,医生也能比较容易地做出判断。比如,量化肌腱退化的程度时,医生的诊断产生的噪声就很小。当病理学家评估乳腺病灶的穿刺活检结果时,他们的评估是比较明确的,几乎没有噪声。
然而,有些诊断根本不涉及判断。医疗水平的进步往往是通过消除判断也就是将判断转变为计算来实现的。对于链球菌性咽喉炎的诊断,医生首先要对患者的咽拭子标本进行快速抗原检测,这种检测可以很快检测出患者是否出现链球菌感染。可以说,即便有这种快速抗原检测结果,链球菌性咽喉炎的诊断也存在噪声,但如果没有,那情况将更糟。如果你的空腹血糖水平为126mg/dL或更高,或是糖化血红蛋白(过去3个月内血糖的平均值)高于6.5HbAlc,你就会被诊断为患有糖尿病。在新型冠状病毒疫情出现的早期阶段,一些医生做初步诊断时是根据症状做出判断的,随着疫情的发展,检验变得越来越普遍,有了检验结果,判断就没有必要了。
当医生做判断时,他们的判断可能会有噪声,而且可能会出错,标准做法是建议患者再咨询另外一位医生,获取第二诊疗意见。在有些医院里,第二诊疗意见是必须给出的。当第二诊疗意见与首诊意见出现分歧时,噪声就出现了——当然,我们可能并不清楚哪位医生是正确的。一些患者(包括前文案例中的保罗)会惊讶地发现第二诊疗意见与首诊意见的分歧非常大。医疗领域存在噪声并不令人惊讶,真正令人惊讶的是其体量之庞大。
在本章中,我们要阐明医疗领域的噪声如何大到了令人惊讶的程度,并介绍医学界使用的一些减少噪声的方法。我们将着重讨论一个决策卫生策略:诊断指南。我们敏锐地意识到,与医学中的噪声以及医生、护士和医院采取的各种补救措施有关的内容中有非常多可写的,轻而易举便能写成一整本书。但值得注意的是,医学中的噪声并不局限于本章所关注的诊断性判断中的噪声,治疗过程也可能存在噪声,关于这个话题也有大量的文献可供参考。比如,对于心脏存在问题的患者,医生们对最佳治疗方案的判断存在惊人的差异,涉及的问题包括该用哪些药物、正确的手术方式是哪个,以及到底需不需要手术等。20多年来,达特茅斯·阿特拉斯项目(The Dartmouth Atlas Project)一直致力于记录“美国在医疗资源分配和使用上存在的显著差异”,当然,许多国家也存在医疗资源分配不均的情况。对于本书来说,我们只需要简单地探讨诊断性判断中存在的噪声就可以了。
医疗诊断中的噪声
有大量文献介绍了医学界存在噪声,其中许多是实证性的且验证了噪声的存在,也有许多文献是指导性的。一些医学领域的论文一直在提出各种各样的减少噪声的策略,这些论文如同一座座金矿,蕴藏着众多极其珍贵的想法,值得许多领域的专家、学者参考借鉴。出现分歧时,噪声就出现了——当然,我们可能并不清楚哪位医生是正确的。一些患者(包括前文案例中的保罗)会惊讶地发现第二诊疗意见与首诊意见的分歧非常大。医疗领域存在噪声并不令人惊讶,真正令人惊讶的是其体量之庞大。
在本章中,我们要阐明医疗领域的噪声如何大到了令人惊讶的程度,并介绍医学界使用的一些减少噪声的方法。我们将着重讨论一个决策卫生策略:诊断指南。我们敏锐地意识到,与医学中的噪声以及医生、护士和医院采取的各种补救措施有关的内容中有非常多可写的,轻而易举便能写成一整本书。但值得注意的是,医学中的噪声并不局限于本章所关注的诊断性判断中的噪声,治疗过程也可能存在噪声,关于这个话题也有大量的文献可供参考。比如,对于心脏存在问题的患者,医生们对最佳治疗方案的判断存在惊人的差异,涉及的问题包括该用哪些药物、正确的手术方式是哪个,以及到底需不需要手术等。20多年来,达特茅斯·阿特拉斯项目(The Dartmouth Atlas Project)一直致力于记录“美国在医疗资源分配和使用上存在的显著差异”,当然,许多国家也存在医疗资源分配不均的情况。对于本书来说,我们只需要简单地探讨诊断性判断中存在的噪声就可以了。
医疗诊断中的噪声
有大量文献介绍了医学界存在噪声,其中许多是实证性的且验证了噪声的存在,也有许多文献是指导性的。一些医学领域的论文一直在提出各种各样的减少噪声的策略,这些论文如同一座座金矿,蕴藏着众多极其珍贵的想法,值得许多领域的专家、学者参考借鉴。若噪声存在,就证明其中一位医生明显是正确的,另一位明显是错误的并且可能受到某些偏差的影响,正如我们料想的那样,医生的技能在其中发挥了关键作用。例如,一项针对放射科医生做出肺炎诊断的研究发现,噪声中很大一部分源自医生技能上的差异。具体而言,“技能的差异可以解释诊断决策中44%的变异”,这表明“提升技能比使用统一的决策指南更有效”。训练和甄选对于减少误差、消除噪声和偏差至关重要,在医疗领域也是如此。
在医学的某些领域,如放射学和病理学,医生对噪声的存在一清二楚。例如,放射科医生将诊断差异称为“阿喀琉斯之踵”。目前尚不清楚到底为什么放射学和病理学领域的噪声如此受关注,可能是因为这些领域的噪声确实比其他领域多,也可能是因为这些领域的噪声更容易被记录下来,我们猜想易于记录可能是更重要的原因。在放射学领域,人们更容易实施一些简单的噪声测试以及误差测试,例如,你可以再看一遍影像片子来对之前的评估结果进行重新评估。
在医学领域,人与人之间的噪声,或者说评估者信度(iterrater reliability),通常用kappa统计量来衡量。kappa值越高,噪声越小。kappa值为1表示评估者们的评估完全一致;kappa值为0,则意味着评估者之间的一致性很差,就跟一群猴子往诊断列表上投飞镖差不多。根据该系数测量得到的信度,医学诊断的某些领域属于“轻度”或者“糟糕”,“糟糕”意味着该领域的噪声非常多。在大多数情况下,该系数测出的信度是“一般”,这当然有所改善,但依然表明其中存在着明显的噪声。随机选出100例药物,要求全科医生判断这些药物之间的相互作用是否具有临床意义,对于这一重要问若噪声存在,就证明其中一位医生明显是正确的,另一位明显是错误的并且可能受到某些偏差的影响,正如我们料想的那样,医生的技能在其中发挥了关键作用。例如,一项针对放射科医生做出肺炎诊断的研究发现,噪声中很大一部分源自医生技能上的差异。具体而言,“技能的差异可以解释诊断决策中44%的变异”,这表明“提升技能比使用统一的决策指南更有效”。训练和甄选对于减少误差、消除噪声和偏差至关重要,在医疗领域也是如此。
在医学的某些领域,如放射学和病理学,医生对噪声的存在一清二楚。例如,放射科医生将诊断差异称为“阿喀琉斯之踵”。目前尚不清楚到底为什么放射学和病理学领域的噪声如此受关注,可能是因为这些领域的噪声确实比其他领域多,也可能是因为这些领域的噪声更容易被记录下来,我们猜想易于记录可能是更重要的原因。在放射学领域,人们更容易实施一些简单的噪声测试以及误差测试,例如,你可以再看一遍影像片子来对之前的评估结果进行重新评估。
在医学领域,人与人之间的噪声,或者说评估者信度(iterrater reliability),通常用kappa统计量来衡量。kappa值越高,噪声越小。kappa值为1表示评估者们的评估完全一致;kappa值为0,则意味着评估者之间的一致性很差,就跟一群猴子往诊断列表上投飞镖差不多。根据该系数测量得到的信度,医学诊断的某些领域属于“轻度”或者“糟糕”,“糟糕”意味着该领域的噪声非常多。在大多数情况下,该系数测出的信度是“一般”,这当然有所改善,但依然表明其中存在着明显的噪声。随机选出100例药物,要求全科医生判断这些药物之间的相互作用是否具有临床意义,对于这一重要问题,医生们做出的判断“一致性很差”。在许多外行眼里,诊断肾脏疾病处于哪一阶段似乎比较简单,甚至很多医生也这样认为。但是,肾病专家们在基于肾病患者的标准化检测结果进行诊断时,仅勉强达到“中等程度的一致性”。
一项研究发现,关于乳腺病变是否为癌变这一问题,病理学家之间只能达成“一般”程度的一致性。在诊断乳腺增生病变时,一致性同样是“一般”。当医生根据核磁共振成像扫描结果判断椎管的狭窄程度时,一致性也是“一般”。这些发现很值得反思,因为我们说过,在医学的某些领域中噪声水平非常低,但在一些对技术性要求非常高的领域,医生们的诊断还远没有实现零噪声。关于是否会被确诊为患有癌症等严重疾病,患者有时就像在抽签,其结果取决于问诊的是哪位医生。
再来看看这些文献中的其他发现,它们源自那些噪声的严重程度尤其值得关注的领域。我们描述这些发现并不是为了对医务工作的现状做出权威性的论断(医务工作在不断地发展和改进,在某些情况下,发展和改进的速度很快),我们的目的是让大家认识到噪声是普遍存在的,不管是在不远的过去还是现在,噪声都屡见不鲜。
1.在美国,心脏病是男性和女性的主要致死原因。冠状动脉造影是检测心脏病的主要方法,可以评估急性和非急性情况下心脏动脉的阻塞程度。在非急性情况下,当患者反复出现胸痛,且有一条或几条动脉的阻塞程度超过70%时,医生通常会对患者实施支架置入术等治疗措施。然而,有资料显示,医生对血管造影图的解释存在一定的变异,这可能引发不必要的手术。一项早期研究发现,评估血管造影题,医生们做出的判断“一致性很差”。在许多外行眼里,诊断肾脏疾病处于哪一阶段似乎比较简单,甚至很多医生也这样认为。但是,肾病专家们在基于肾病患者的标准化检测结果进行诊断时,仅勉强达到“中等程度的一致性”。
一项研究发现,关于乳腺病变是否为癌变这一问题,病理学家之间只能达成“一般”程度的一致性。在诊断乳腺增生病变时,一致性同样是“一般”。当医生根据核磁共振成像扫描结果判断椎管的狭窄程度时,一致性也是“一般”。这些发现很值得反思,因为我们说过,在医学的某些领域中噪声水平非常低,但在一些对技术性要求非常高的领域,医生们的诊断还远没有实现零噪声。关于是否会被确诊为患有癌症等严重疾病,患者有时就像在抽签,其结果取决于问诊的是哪位医生。
再来看看这些文献中的其他发现,它们源自那些噪声的严重程度尤其值得关注的领域。我们描述这些发现并不是为了对医务工作的现状做出权威性的论断(医务工作在不断地发展和改进,在某些情况下,发展和改进的速度很快),我们的目的是让大家认识到噪声是普遍存在的,不管是在不远的过去还是现在,噪声都屡见不鲜。
1.在美国,心脏病是男性和女性的主要致死原因。冠状动脉造影是检测心脏病的主要方法,可以评估急性和非急性情况下心脏动脉的阻塞程度。在非急性情况下,当患者反复出现胸痛,且有一条或几条动脉的阻塞程度超过70%时,医生通常会对患者实施支架置入术等治疗措施。然而,有资料显示,医生对血管造影图的解释存在一定的变异,这可能引发不必要的手术。一项早期研究发现,评估血管造影
管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2023-09-05
场上实现差异化而显出竞争优势。当产品以差异化在市场上取胜之后,就能有效地增强客户黏性和忠诚度。客户对企业的产品或服务有了黏性和忠诚度之后,企业就不仅可以取得经济收益,还能有效地降低成本。如果用一个比喻形容低成本竞争战略和差异化竞争战略,就是对一家企业来说,与其损耗“元气”跟速度极快的企业赛跑,还不如自己去创造一条新的跑道,即根据自身当前所拥有的资源和经营业务
管理类 / 日期:2023-09-05
管理者的第三项工作是激励与沟通。管理者把担任各项职务的人组织成一个团队。他做到这一点的方法是,通过日常的工作实践,通过员工关系,通过有关报酬、安置和提升的“人事决定”,通过同其下级、上级和同级之间经常的相互信息交流等来实现。激励和沟通所需的主要是社会方面的技能,不是分析能力,而是正直的品格和综合能力。正直的品格比分析能力重要得多。管理者的第四项工作是绩效评估