当一组判断中的大部分错误都指向同一个方向时,我们就认为这组判断出现了偏差,偏差即平均误差。例如,整队射击手连续命中靶子的左下方;公司高管年复一年地对销售额做出过高的估计;公司对本该撤销的失败项目持续进行投资。这些都是偏差。
消除一系列判断中的偏差并不能消除所有误差,消除偏差后仍然(12)残留的误差缺少共性。它们是我们在做判断的过程中不希望存在的分歧,体现了我们将测量工具应用于实际时的不稳定性。这种变异就是噪声。噪声是本该相同的判断中出现的变异。我们用“系统噪声”这一术语来描述组织中具有同质性的专业人士,如急诊医生、量刑法官以及保险公司核保员在做决策时出现的噪声。本书的大部分内容都在讨论系统噪声的问题。
测量偏差和噪声
均方误差(MSE)是科学测量学中已经沿用了近200年的测量准确性的标准。均方误差的主要特征是:它将样本均值作为总体均值的无偏估计,同等对待正误差和负误差,并且不成比例地处理较大的误差,因此,均方误差不能反映判断误差的实际代价——误差的实际代价往往是非对称的。然而,专业决策往往需要做出准确的预测。对于一个即将面临飓风袭击的城市,低估和高估飓风威胁所需付出的代价显然是非对称的,但你不希望这些代价影响气象学家对风暴速度和轨迹的预测。对于此类以追求客观准确性为目的的预测性判断来说,均方误差是合适的判断标准。当一组判断中的大部分错误都指向同一个方向时,我们就认为这组判断出现了偏差,偏差即平均误差。例如,整队射击手连续命中靶子的左下方;公司高管年复一年地对销售额做出过高的估计;公司对本该撤销的失败项目持续进行投资。这些都是偏差。
消除一系列判断中的偏差并不能消除所有误差,消除偏差后仍然(12)残留的误差缺少共性。它们是我们在做判断的过程中不希望存在的分歧,体现了我们将测量工具应用于实际时的不稳定性。这种变异就是噪声。噪声是本该相同的判断中出现的变异。我们用“系统噪声”这一术语来描述组织中具有同质性的专业人士,如急诊医生、量刑法官以及保险公司核保员在做决策时出现的噪声。本书的大部分内容都在讨论系统噪声的问题。
测量偏差和噪声
均方误差(MSE)是科学测量学中已经沿用了近200年的测量准确性的标准。均方误差的主要特征是:它将样本均值作为总体均值的无偏估计,同等对待正误差和负误差,并且不成比例地处理较大的误差,因此,均方误差不能反映判断误差的实际代价——误差的实际代价往往是非对称的。然而,专业决策往往需要做出准确的预测。对于一个即将面临飓风袭击的城市,低估和高估飓风威胁所需付出的代价显然是非对称的,但你不希望这些代价影响气象学家对风暴速度和轨迹的预测。对于此类以追求客观准确性为目的的预测性判断来说,均方误差是合适的判断标准。偏差和噪声都可以用均方误差来独立测量,而它们都是误差的来源。显然,偏差通常是有害的,减小偏差总是能提高判断的准确性;而噪声同样有害,减少噪声也同样总是能提升判断力。但是从直觉上说,这一事实却不那么容易被大家接受,人们通常希望,即使判断中存在明显偏差,离散度也最好为0。当然,我们最终的目标是同时使偏差和噪声最小化。
一系列可验证的判断中的偏差指的是案例的平均判断与其真实值之间的差异。而对于无法验证的判断,则无法进行这种比较。例如,承保人为特定风险设定的保费,其真实值永远不可知。对于某项特定罪行来说,我们也无法轻易知道公正判决的真实值是什么。在缺乏真实值的情况下,一个最常用、最方便(虽然并非总是正确)的假设是:判断是不偏不倚的,多名法官的平均值就是对真实值的最佳估计。
我们可以通过噪声审查来评估系统中的噪声。在噪声审查过程中,几名专业人员对同一案例(真实的或虚构的)做出独立判断,我们可以在不知道真实值的情况下测量噪声,就像我们从靶子背面看到一堆弹孔的分布图一样。噪声审查可以衡量许多系统中判断的变异性,包括放射科和刑事司法制度,有时还会让人们关注到技能或训练的不足。此外,噪声审查还可以对系统噪声进行量化,例如同一团队中的核保员对风险的评估有所不同的情形。
偏差和噪声哪个问题更大呢?这要依据实际情况而定,答案很可能是噪声。当误差的平均值(偏差)与误差的标准差(噪声)相等时,偏差和噪声对总体误差的贡献相同。如果判断呈正态分布,即标准钟形曲线,那么只有当84%的判断都高于或低于真实值时,偏差和噪声偏差和噪声都可以用均方误差来独立测量,而它们都是误差的来源。显然,偏差通常是有害的,减小偏差总是能提高判断的准确性;而噪声同样有害,减少噪声也同样总是能提升判断力。但是从直觉上说,这一事实却不那么容易被大家接受,人们通常希望,即使判断中存在明显偏差,离散度也最好为0。当然,我们最终的目标是同时使偏差和噪声最小化。
一系列可验证的判断中的偏差指的是案例的平均判断与其真实值之间的差异。而对于无法验证的判断,则无法进行这种比较。例如,承保人为特定风险设定的保费,其真实值永远不可知。对于某项特定罪行来说,我们也无法轻易知道公正判决的真实值是什么。在缺乏真实值的情况下,一个最常用、最方便(虽然并非总是正确)的假设是:判断是不偏不倚的,多名法官的平均值就是对真实值的最佳估计。
我们可以通过噪声审查来评估系统中的噪声。在噪声审查过程中,几名专业人员对同一案例(真实的或虚构的)做出独立判断,我们可以在不知道真实值的情况下测量噪声,就像我们从靶子背面看到一堆弹孔的分布图一样。噪声审查可以衡量许多系统中判断的变异性,包括放射科和刑事司法制度,有时还会让人们关注到技能或训练的不足。此外,噪声审查还可以对系统噪声进行量化,例如同一团队中的核保员对风险的评估有所不同的情形。
偏差和噪声哪个问题更大呢?这要依据实际情况而定,答案很可能是噪声。当误差的平均值(偏差)与误差的标准差(噪声)相等时,偏差和噪声对总体误差的贡献相同。如果判断呈正态分布,即标准钟形曲线,那么只有当84%的判断都高于或低于真实值时,偏差和噪声的影响才相等。这其实是很大的偏差,这么大的偏差很容易就能被专业人员检测到。而当偏差小于一个标准差时,噪声就是总误差中更大的错误来源了。
噪声是个问题,远超我们的想象
分歧在某些判断场景中是没有问题的,甚至是有必要的。观点的多样性对于激发创意和产生多种设想必不可少,标新立异的思维对于创新也至关重要。比如,电影评论家多元化的观点是优势而非劣势;交易员之间的分歧促进了市场的繁荣;相互竞争的创业公司之间的战略差异使市场能够优胜劣汰。但是,在我们所讨论的判断问题上,系统噪声永远是一个问题,如果两位医生给你做出了不同的诊断,那么其中至少有一种诊断是错误的。
系统噪声的绝对数量及其造成的破坏程度之大令人震惊,这也正是我们撰写本书的动力所在。两者都远远超出了我们的预期。我们在本书中提及了商业、医学、刑事司法、指纹分析、天气预报、绩效考核和政治等许多领域的案例,并从中得出了结论:哪里有判断,哪里就有噪声,而且其数量之大远超我们的想象。
噪声在误差中的重大作用与人们普遍拥有的一种观念相悖,即“随机误差不重要”,因为他们可以“相互抵消”。然而,这种观念是错误的,如果靶心周围散布着很多弹孔,那么说“平均下来射击手击中了靶心”是毫无意义的。如果一名应聘者的得分高于他的实际水平,而另一名应聘者的得分低于他的实际水平,则可能导致用人单位聘错的影响才相等。这其实是很大的偏差,这么大的偏差很容易就能被专业人员检测到。而当偏差小于一个标准差时,噪声就是总误差中更大的错误来源了。
噪声是个问题,远超我们的想象
分歧在某些判断场景中是没有问题的,甚至是有必要的。观点的多样性对于激发创意和产生多种设想必不可少,标新立异的思维对于创新也至关重要。比如,电影评论家多元化的观点是优势而非劣势;交易员之间的分歧促进了市场的繁荣;相互竞争的创业公司之间的战略差异使市场能够优胜劣汰。但是,在我们所讨论的判断问题上,系统噪声永远是一个问题,如果两位医生给你做出了不同的诊断,那么其中至少有一种诊断是错误的。
系统噪声的绝对数量及其造成的破坏程度之大令人震惊,这也正是我们撰写本书的动力所在。两者都远远超出了我们的预期。我们在本书中提及了商业、医学、刑事司法、指纹分析、天气预报、绩效考核和政治等许多领域的案例,并从中得出了结论:哪里有判断,哪里就有噪声,而且其数量之大远超我们的想象。
噪声在误差中的重大作用与人们普遍拥有的一种观念相悖,即“随机误差不重要”,因为他们可以“相互抵消”。然而,这种观念是错误的,如果靶心周围散布着很多弹孔,那么说“平均下来射击手击中了靶心”是毫无意义的。如果一名应聘者的得分高于他的实际水平,而另一名应聘者的得分低于他的实际水平,则可能导致用人单位聘错人。如果一份保单的保费过高,而另一份保单的保费过低,这两种错误对保险公司而言都是代价高昂的:前一种情况可能会使公司丢了生意,后一种情况则会使公司赔钱。
简而言之,如果缺少正当的、导致判断差异性过大的理由,那么判断过程一定存在误差。而且,即使我们无法对判断进行验证以及对误差进行测量,噪声也是有害的。“同罪不同罚”是不公平的,在一个系统中,如果相关人员的专业判断缺乏一致性,那么这个系统就会失去公信力。
水平、模式、情境,噪声的3种类型
系统噪声可分为水平噪声和模式噪声。有些法官通常很严厉,而另一些法官则更宽容;一些股票预测者总是预测牛市,另一些则总是预测熊市;有些医生开的抗生素比其他医生多。水平噪声是不同个体平均判断上的变异性,判断量表的模糊性是水平噪声的来源之一。像“可能”这样的词或“0~6分量表中的4分”这样的数字对不同的人来说含义是不同的。水平噪声是判断系统中的误差的重要来源,也是减少噪声过程中的一个重要干预对象。
系统噪声还包含另一种成分,这种成分通常占比更大。无论判决的平均水平如何,不同的法官对于哪种罪行应受更严厉的刑罚的看法可能有所不同。法官们的不同判决会导致对不同案件的排序不同。我们称这种变异为模式噪声[统计术语为“统计交互作用”(statistical iteractio)]。人。如果一份保单的保费过高,而另一份保单的保费过低,这两种错误对保险公司而言都是代价高昂的:前一种情况可能会使公司丢了生意,后一种情况则会使公司赔钱。
简而言之,如果缺少正当的、导致判断差异性过大的理由,那么判断过程一定存在误差。而且,即使我们无法对判断进行验证以及对误差进行测量,噪声也是有害的。“同罪不同罚”是不公平的,在一个系统中,如果相关人员的专业判断缺乏一致性,那么这个系统就会失去公信力。
水平、模式、情境,噪声的3种类型
系统噪声可分为水平噪声和模式噪声。有些法官通常很严厉,而另一些法官则更宽容;一些股票预测者总是预测牛市,另一些则总是预测熊市;有些医生开的抗生素比其他医生多。水平噪声是不同个体平均判断上的变异性,判断量表的模糊性是水平噪声的来源之一。像“可能”这样的词或“0~6分量表中的4分”这样的数字对不同的人来说含义是不同的。水平噪声是判断系统中的误差的重要来源,也是减少噪声过程中的一个重要干预对象。
系统噪声还包含另一种成分,这种成分通常占比更大。无论判决的平均水平如何,不同的法官对于哪种罪行应受更严厉的刑罚的看法可能有所不同。法官们的不同判决会导致对不同案件的排序不同。我们称这种变异为模式噪声[统计术语为“统计交互作用”(statistical iteractio)]。模式噪声的主要来源是稳定的,如不同法官对同一案件所做出的个体化、特异性的反应。其中一些差异反映了个体(有意识或无意识)遵循的原则或价值观。例如,一位法官对偷盗者可能特别严厉,而对违反交通法规的人则较宽容;另一位法官可能刚好相反。某些潜在的原则或价值观可能非常复杂,而判断者可能对此毫无意识。例如,某位法官可能对年龄较大的偷盗者比较宽容,他自己却完全没有意识到这一点。同时,对特定案例高度个体化的反应也可能是稳定的,比如,某位法官由于觉得被告长得像自己的孩子,从而对被告产生了怜悯之情,并对被告予以宽大处理。这位法官在不同时间里遇到这种情况,他都会如此。
这种稳定的模式噪声反映了法官的独特性:他们对案件的反应与他们独一无二的人格特征一样。人与人之间的细微差异通常很微妙也很有趣,但是,在需要一致性判断的系统中,这种由专业人员做出的判断间的差异是有问题的。在我们所考察的研究中,这种因个体差异而产生的稳定的模式噪声通常是系统噪声的最大来源。
尽管如此,法官对特定案件的不同态度也不完全是稳定的,也就是说模式噪声也包含一个可变成分,我们称之为情境噪声。如果放射科医生在不同的日子里对同一张影像片子做出了不同的诊断,或是指纹鉴定师有时认为两个指纹是匹配的,有时则认为是不匹配的,我们就能在其中检测到情境噪声。正如上述例子所示,如果判断者没能识别出某个案例是他以前处理过的案例,我们很容易在他做判断的过程中测量出情境噪声。另一种证明存在情境噪声的方式是发现与判断无关的背景因素对判断产生了影响。例如,当法官最喜欢的足球队获胜模式噪声的主要来源是稳定的,如不同法官对同一案件所做出的个体化、特异性的反应。其中一些差异反映了个体(有意识或无意识)遵循的原则或价值观。例如,一位法官对偷盗者可能特别严厉,而对违反交通法规的人则较宽容;另一位法官可能刚好相反。某些潜在的原则或价值观可能非常复杂,而判断者可能对此毫无意识。例如,某位法官可能对年龄较大的偷盗者比较宽容,他自己却完全没有意识到这一点。同时,对特定案例高度个体化的反应也可能是稳定的,比如,某位法官由于觉得被告长得像自己的孩子,从而对被告产生了怜悯之情,并对被告予以宽大处理。这位法官在不同时间里遇到这种情况,他都会如此。
这种稳定的模式噪声反映了法官的独特性:他们对案件的反应与他们独一无二的人格特征一样。人与人之间的细微差异通常很微妙也很有趣,但是,在需要一致性判断的系统中,这种由专业人员做出的判断间的差异是有问题的。在我们所考察的研究中,这种因个体差异而产生的稳定的模式噪声通常是系统噪声的最大来源。
尽管如此,法官对特定案件的不同态度也不完全是稳定的,也就是说模式噪声也包含一个可变成分,我们称之为情境噪声。如果放射科医生在不同的日子里对同一张影像片子做出了不同的诊断,或是指纹鉴定师有时认为两个指纹是匹配的,有时则认为是不匹配的,我们就能在其中检测到情境噪声。正如上述例子所示,如果判断者没能识别出某个案例是他以前处理过的案例,我们很容易在他做判断的过程中测量出情境噪声。另一种证明存在情境噪声的方式是发现与判断无关的背景因素对判断产生了影响。例如,当法官最喜欢的足球队获胜
管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2024-02-01
构建工作。美国发布了若干版本的标准化战略,以美国标准体系为对象,阐述美国国家标准体系的目标定位、制定原则和实施策略等。德国、英国等国家也分别发布了国家标准化战略,明确国家标准体系的目标、定位和实施策略。第二,明确标准体系的构成要素,或者将什么范围内的标准纳入标准体系的考虑之中。构成标准体系的元素是标准。但是,对企业来说,标准的范围可大可小。不同的企业,有不同
管理类 / 日期:2024-01-31
参考图3。图3(在我们模拟的案例中)向我们展示了这20种产品,或者说是产品总数的20%,创造了80%的利润总额(阴影区域)。相反,白色区域,我们可以看到这种关系的对立面:产品总数的80%,仅创造了20%的利润总额。 二八数量关系只是一种基准,真正的比例关系可能会围绕80/20上下浮动。然而,二八定律认为:大多数情况下,这种关系的比例更接近80/20