图的医生对大血管阻塞是否超过70%持不同意见,这种情况发生的可能性为31%。心脏病专家普遍意识到,在解读血管造影图时存在潜在的变异,尽管他们不断努力并采取纠正措施,但这个问题仍未解决。
2.子宫内膜异位症是本应该生长在子宫内的子宫内膜组织生长在子宫外所致,这种异位会令病人痛苦不堪,并且可能引发生育障碍。医生一般借助腹腔镜对这种疾病进行诊断,在诊断过程中,医生需要通过手术将腹腔镜的微型摄像头探入患者体内。研究人员让108名妇科医生观看了3名患者的腹腔镜检查视频并做出判断,其中2名患者患有不同程度的子宫内膜异位症,1名患者未患此病。然而,这些医生在判断子宫内膜异位病灶的数量和位置时,产生了很大分歧,并且这些判断在数量和位置上的相关性都很弱。
3.肺结核是全球范围内传播最广、致死率最高的疾病之一。仅2016年,就有1000多万人感染肺结核,死亡人数接近200万。胸部X线检测是一种广泛使用的肺结核检测方法,它可以检测肺部是否出现了由结核杆菌引起的空洞。医生们在肺结核诊断上存在的变异性已有近75年的详尽记录了。尽管这种现象在过去几十年中已有所改善,但研究发现,肺结核诊断中依然存在显著的变异性,诊断一致性仅为“中等”或“一般”。此外,不同国家的放射科医生在肺结核的诊断上也存在差异。
4.当病理学家分析黑色素瘤(最危险的皮肤癌)导致的皮肤病变时,只有“中等”程度的一致性。研究人员要求8位病理学家对每个病例进行诊断,所有病理学家全部达成一致或只有一位意见不一致的情况只占62%。另一项在肿瘤中心开展的研究发现,黑色素瘤的诊图的医生对大血管阻塞是否超过70%持不同意见,这种情况发生的可能性为31%。心脏病专家普遍意识到,在解读血管造影图时存在潜在的变异,尽管他们不断努力并采取纠正措施,但这个问题仍未解决。
2.子宫内膜异位症是本应该生长在子宫内的子宫内膜组织生长在子宫外所致,这种异位会令病人痛苦不堪,并且可能引发生育障碍。医生一般借助腹腔镜对这种疾病进行诊断,在诊断过程中,医生需要通过手术将腹腔镜的微型摄像头探入患者体内。研究人员让108名妇科医生观看了3名患者的腹腔镜检查视频并做出判断,其中2名患者患有不同程度的子宫内膜异位症,1名患者未患此病。然而,这些医生在判断子宫内膜异位病灶的数量和位置时,产生了很大分歧,并且这些判断在数量和位置上的相关性都很弱。
3.肺结核是全球范围内传播最广、致死率最高的疾病之一。仅2016年,就有1000多万人感染肺结核,死亡人数接近200万。胸部X线检测是一种广泛使用的肺结核检测方法,它可以检测肺部是否出现了由结核杆菌引起的空洞。医生们在肺结核诊断上存在的变异性已有近75年的详尽记录了。尽管这种现象在过去几十年中已有所改善,但研究发现,肺结核诊断中依然存在显著的变异性,诊断一致性仅为“中等”或“一般”。此外,不同国家的放射科医生在肺结核的诊断上也存在差异。
4.当病理学家分析黑色素瘤(最危险的皮肤癌)导致的皮肤病变时,只有“中等”程度的一致性。研究人员要求8位病理学家对每个病例进行诊断,所有病理学家全部达成一致或只有一位意见不一致的情况只占62%。另一项在肿瘤中心开展的研究发现,黑色素瘤的诊断准确率只有64%,这意味着每3个被诊断为黑色素瘤的病灶中就有1个属于误诊。还有一项研究发现,纽约大学的皮肤科医生有36%的可能性无法根据皮肤活检样本诊断出黑色素瘤。这项研究的作者总结道:“医生如果未能在临床上正确诊断出黑色素瘤,就会放任这种潜在致命疾病对患者的生命构成严重威胁。”
5.放射科医生通过乳房X线检测来诊断乳腺癌,这种诊断同样存在变异性。一项大型研究发现,放射科医生诊断结果的假阴性率为0%(每次的诊断都是正确的)~50%(甚至超过50%,也就是说在超过一半的情况中,放射科医生错误地将乳腺癌患者的X线片诊断为正常),而假阳性率为1%~64%(这意味着放射科医生将未患乳腺癌的人的X线片诊断为患有乳腺癌的可能性接近2/3)。同时,不同放射科医生诊断的假阴性率和假阳性率也不同,这证明确有噪声存在。
这些存在于不同人之间的噪声是当下的主要研究方向,但也有一些发现是关于情境噪声的。有时候,放射科医生两次评估同一张影像片子时会给出不同的意见,也就是说第二次给出的意见与第一次的意见不一致。但相比于与他人意见不一致的情况,与自己原有的意见不一致的情况较少出现。在重新评估血管造影显示的血管阻塞程度时,22名医生与自己原有意见不一致的可能性为63%~92%。我们可以看到,在那些标准模糊和判断情境复杂的领域中,评估者的信度可能非常差。
这些研究对这种情境噪声的成因没有明确的解释,而另一项不涉及诊断的研究发现了医学领域情境噪声的一个简单来源,这一发现值得患者和医生牢记。简而言之,医生在清晨比接近傍晚时更可能要求断准确率只有64%,这意味着每3个被诊断为黑色素瘤的病灶中就有1个属于误诊。还有一项研究发现,纽约大学的皮肤科医生有36%的可能性无法根据皮肤活检样本诊断出黑色素瘤。这项研究的作者总结道:“医生如果未能在临床上正确诊断出黑色素瘤,就会放任这种潜在致命疾病对患者的生命构成严重威胁。”
5.放射科医生通过乳房X线检测来诊断乳腺癌,这种诊断同样存在变异性。一项大型研究发现,放射科医生诊断结果的假阴性率为0%(每次的诊断都是正确的)~50%(甚至超过50%,也就是说在超过一半的情况中,放射科医生错误地将乳腺癌患者的X线片诊断为正常),而假阳性率为1%~64%(这意味着放射科医生将未患乳腺癌的人的X线片诊断为患有乳腺癌的可能性接近2/3)。同时,不同放射科医生诊断的假阴性率和假阳性率也不同,这证明确有噪声存在。
这些存在于不同人之间的噪声是当下的主要研究方向,但也有一些发现是关于情境噪声的。有时候,放射科医生两次评估同一张影像片子时会给出不同的意见,也就是说第二次给出的意见与第一次的意见不一致。但相比于与他人意见不一致的情况,与自己原有的意见不一致的情况较少出现。在重新评估血管造影显示的血管阻塞程度时,22名医生与自己原有意见不一致的可能性为63%~92%。我们可以看到,在那些标准模糊和判断情境复杂的领域中,评估者的信度可能非常差。
这些研究对这种情境噪声的成因没有明确的解释,而另一项不涉及诊断的研究发现了医学领域情境噪声的一个简单来源,这一发现值得患者和医生牢记。简而言之,医生在清晨比接近傍晚时更可能要求患者做癌症筛查。在一个大样本中,早上8点,乳腺和结肠筛查的预约率最高,为63.7%,到了上午11点,预约率下降至48.7%,中午时又上升至56.2%,下午5点则降至47.8%。因此,在一天中的晚些时候,医生建议就诊的患者做指南推荐的癌症筛查的可能性较小。
我们如何解释这些发现?有可能是因为医生们在遇到患有复杂疾病的患者后,他们的问诊进度会不可避免地落后,这些病情复杂的患者需要的诊断时间往往超过常规的20分钟。我们在前面提到过压力和疲劳等情境噪声的触发因素(见第7章),这样看来这些因素的确在起作用。一些医生为了赶上进度,跳过了对预防性健康措施的讨论。还有一个例子也能说明临床医生会受到疲劳的影响,那就是规范洗手的比率在轮班结束时会低一点,可以说洗手这一过程也充满了噪声。
诊断指南的价值
在不同医学问题的情境中,对噪声的存在及其数量进行全面记录,不仅对医学领域意义重大,而且对人类的认知也有举足轻重的贡献。虽然我们不知道目前是否有此类记录,但希望时机成熟后有人能够完成这一壮举。不过,即使现在没有这类记录,现有的研究结果也提供了一些线索。
在极端情况下,一些问题和疾病的诊断基本上是机械性的工作,不需要做出任何判断。还有一些情况,诊断虽然不是机械性的工作,却很简单直接:任何受过医学训练的人都可能得出同样的结论。在某些场景中,噪声的数量也能得到控制,比如说肺癌专家在进行诊断时,患者做癌症筛查。在一个大样本中,早上8点,乳腺和结肠筛查的预约率最高,为63.7%,到了上午11点,预约率下降至48.7%,中午时又上升至56.2%,下午5点则降至47.8%。因此,在一天中的晚些时候,医生建议就诊的患者做指南推荐的癌症筛查的可能性较小。
我们如何解释这些发现?有可能是因为医生们在遇到患有复杂疾病的患者后,他们的问诊进度会不可避免地落后,这些病情复杂的患者需要的诊断时间往往超过常规的20分钟。我们在前面提到过压力和疲劳等情境噪声的触发因素(见第7章),这样看来这些因素的确在起作用。一些医生为了赶上进度,跳过了对预防性健康措施的讨论。还有一个例子也能说明临床医生会受到疲劳的影响,那就是规范洗手的比率在轮班结束时会低一点,可以说洗手这一过程也充满了噪声。
诊断指南的价值
在不同医学问题的情境中,对噪声的存在及其数量进行全面记录,不仅对医学领域意义重大,而且对人类的认知也有举足轻重的贡献。虽然我们不知道目前是否有此类记录,但希望时机成熟后有人能够完成这一壮举。不过,即使现在没有这类记录,现有的研究结果也提供了一些线索。
在极端情况下,一些问题和疾病的诊断基本上是机械性的工作,不需要做出任何判断。还有一些情况,诊断虽然不是机械性的工作,却很简单直接:任何受过医学训练的人都可能得出同样的结论。在某些场景中,噪声的数量也能得到控制,比如说肺癌专家在进行诊断时,他们的专业性虽不能完全消除噪声,但能使噪声数量最少。有些疾病的诊断给了医生很大的判断空间,并且诊断的相关标准过于宽泛,这会导致噪声数量巨大,且难以降低。我们将看到,大部分精神病学诊断就属于这种情况。
怎样才能降低医学领域的噪声呢?我们在前面提到,培训可以提高医生的技能,而高超的技能当然对减少噪声有帮助。汇总多个专家的判断(如第二诊疗意见等)也能减少噪声。算法是一个特别有发展前景的诊断手段,医生们现在正在使用深度学习算法和人工智能来减少噪声。例如,这类算法已经被用于检测乳腺癌患者的淋巴转移情况。目前最好的算法的诊断准确性优于最好的病理学家。当然,算法是没有噪声的。深度学习算法在检测与糖尿病相关的眼部问题方面,已经取得了巨大的成功。人工智能在通过乳房X线检测诊断癌症方面的表现,几乎和放射科医生一样出色。如果人工智能进一步发展,它的表现可能会比人类更好。
未来医学界可能会越来越依赖算法。这个过程可以同时减少偏差和噪声,挽救生命并节省成本。但本章的重点是人类的判断指南,因为医学领域的情况能够充分说明,指南在某些实践应用中能够确保产生良好甚至极好的结果,而在其他应用实践中会产生更复杂的结果。
1952年由产科麻醉师弗吉尼亚·阿普加(Virgiia Apgar)发明的阿普加评分(Apgar score),也许是诊断指南最知名的例子。过去,评估新生儿是否处于危险之中曾是医生和助产士需要做出的临床判断。阿普加评分给了他们一个标准化的指南,供他们评测婴儿的肤色、心率、反射动作、肌肉张力和呼吸状况。这些指标的首字母刚好组成他们的专业性虽不能完全消除噪声,但能使噪声数量最少。有些疾病的诊断给了医生很大的判断空间,并且诊断的相关标准过于宽泛,这会导致噪声数量巨大,且难以降低。我们将看到,大部分精神病学诊断就属于这种情况。
怎样才能降低医学领域的噪声呢?我们在前面提到,培训可以提高医生的技能,而高超的技能当然对减少噪声有帮助。汇总多个专家的判断(如第二诊疗意见等)也能减少噪声。算法是一个特别有发展前景的诊断手段,医生们现在正在使用深度学习算法和人工智能来减少噪声。例如,这类算法已经被用于检测乳腺癌患者的淋巴转移情况。目前最好的算法的诊断准确性优于最好的病理学家。当然,算法是没有噪声的。深度学习算法在检测与糖尿病相关的眼部问题方面,已经取得了巨大的成功。人工智能在通过乳房X线检测诊断癌症方面的表现,几乎和放射科医生一样出色。如果人工智能进一步发展,它的表现可能会比人类更好。
未来医学界可能会越来越依赖算法。这个过程可以同时减少偏差和噪声,挽救生命并节省成本。但本章的重点是人类的判断指南,因为医学领域的情况能够充分说明,指南在某些实践应用中能够确保产生良好甚至极好的结果,而在其他应用实践中会产生更复杂的结果。
1952年由产科麻醉师弗吉尼亚·阿普加(Virgiia Apgar)发明的阿普加评分(Apgar score),也许是诊断指南最知名的例子。过去,评估新生儿是否处于危险之中曾是医生和助产士需要做出的临床判断。阿普加评分给了他们一个标准化的指南,供他们评测婴儿的肤色、心率、反射动作、肌肉张力和呼吸状况。这些指标的首字母刚好组成Apgar:外貌(Appearace,指肤色)、脉搏(pulse,指心率)、痛苦反应(grimace,指反射动作)、活动(activity,指肌肉张力)和呼吸(respiratio,指呼吸频率和力度)。在阿普加测试中,这5个指标分别对应3个分数:0、1和2。总分最高为10分。7分及以上就可被视为健康状况合格(见表22-1)。
表22-1 阿普加评分指南Apgar:外貌(Appearace,指肤色)、脉搏(pulse,指心率)、痛苦反应(grimace,指反射动作)、活动(activity,指肌肉张力)和呼吸(respiratio,指呼吸频率和力度)。在阿普加测试中,这5个指标分别对应3个分数:0、1和2。总分最高为10分。7分及以上就可被视为健康状况合格(见表22-1)。
表22-1 阿普加评分指南
管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2022-11-17
利完成了五年计划,让我看到了如今的盛况,真是欣喜异常。我也已经六十岁了。想借此机会从社长的位子上退下来,以后将作为会长,在后方继续关注公司的经验状况。”这些出人意料的话语立刻在会场中引起了一阵骚动。其实,他是为了调动全体员工的精神,故意采用这种戏剧化的公布方式。就这样,松下正治接任了社长的位子,高桥任副社长、中尾任专务,由他们两人来辅助新社长。幸之助当上了会
管理类 / 日期:2022-11-17
进。其二,第四次工业革命对创新导向的企业组织构架设计理念的内在需求。随着第四次工业革命的深入和互联网时代的来临,一方面,“大数据”的数据采集方式和“云计算”的数据处理能力使长期困扰资本市场投融资双方的信息不对称问题严重程度有所减轻;另一方面,投融资双方对业务模式创新的信息不对称程度反而加剧了。对于业务模式创新等专业决策,外部投资者不得不交给少数“术业有专攻”