我们早期对噪声成分的思考基于复杂的噪声审......《噪声》摘录

管理类 日期 2022-12-06
我们早期对噪声成分的思考基于复杂的噪声审查框架。在该框架中,多个人对多个案例做出判断。美国联邦法官的研究以及惩罚性损害赔偿的研究,都是这样的例子。从这些研究中获得的数据能够对水平噪声进行可靠的估计。另外,虽然每个参与者都对每个案例进行了判断,但只进行了一次,因此无法判断残差是变化的还是稳定的。我们将残差称为模式误差。依据统计分析的保守性原则,残差通常被视为随机误差。换句话说,模式噪声被完全默认为情境噪声。

很长一段时间以来,这种将模式噪声解释为随机误差的传统做法限制了我们的思维。专注水平噪声,比如严厉和宽容的判断者之间、乐观和悲观的预测者之间的稳定性差异,似乎是自然而然的事。但是,有证据表明,那些无关的、变化的环境也会影响判断,从而产生情境噪声,这引起了我们的研究兴趣。

这些证据让我们逐渐认识到,人们做出的判断之所以充满噪声,很大程度上既不是因为个体的普遍性偏差,也并非变化的或随机的因素所致;特定个体对多重特征持续出现的个体化反应,决定了他们对具体案例的反应。我们最终得出结论,我们应该摈弃“模式噪声是随机变化的”这一观点。

虽然我们很想谨慎一点,尽量避免根据有限的案例做出过度概括的陈述,但是整合所做的研究后,我们发现,稳定的模式噪声实际上比系统噪声的其他成分更为重要。我们很少在同一研究中全面地探究误差的各个组成部分,因此需要进行精确的分析才能得出这样一个暂时性的结论。简而言之,以下就是我们已知和未知的内容。我们早期对噪声成分的思考基于复杂的噪声审查框架。在该框架中,多个人对多个案例做出判断。美国联邦法官的研究以及惩罚性损害赔偿的研究,都是这样的例子。从这些研究中获得的数据能够对水平噪声进行可靠的估计。另外,虽然每个参与者都对每个案例进行了判断,但只进行了一次,因此无法判断残差是变化的还是稳定的。我们将残差称为模式误差。依据统计分析的保守性原则,残差通常被视为随机误差。换句话说,模式噪声被完全默认为情境噪声。

很长一段时间以来,这种将模式噪声解释为随机误差的传统做法限制了我们的思维。专注水平噪声,比如严厉和宽容的判断者之间、乐观和悲观的预测者之间的稳定性差异,似乎是自然而然的事。但是,有证据表明,那些无关的、变化的环境也会影响判断,从而产生情境噪声,这引起了我们的研究兴趣。

这些证据让我们逐渐认识到,人们做出的判断之所以充满噪声,很大程度上既不是因为个体的普遍性偏差,也并非变化的或随机的因素所致;特定个体对多重特征持续出现的个体化反应,决定了他们对具体案例的反应。我们最终得出结论,我们应该摈弃“模式噪声是随机变化的”这一观点。

虽然我们很想谨慎一点,尽量避免根据有限的案例做出过度概括的陈述,但是整合所做的研究后,我们发现,稳定的模式噪声实际上比系统噪声的其他成分更为重要。我们很少在同一研究中全面地探究误差的各个组成部分,因此需要进行精确的分析才能得出这样一个暂时性的结论。简而言之,以下就是我们已知和未知的内容。成分的大小:稳定的模式噪声几乎是水平噪声的4倍之多

首先,我们对水平噪声和模式噪声的相对权重进行了几种估算。总体而言,模式噪声似乎比水平噪声对系统噪声的影响更大。例如,在第2章提到的保险公司的例子中,不同核保人在平均保费上的差异仅占总体系统噪声的20%,剩余的80%都是模式噪声。在第6章提到的美国联邦法官的例子中,水平噪声(平均严厉程度的差异)在总体系统噪声中的占比略低于一半,而模式噪声则占一半以上。在惩罚性损害赔偿的实验中,系统噪声的总量在不同量表(惩罚倾向、愤怒程度或赔偿金额)上差别较大,但模式噪声的占比却基本恒定:三种量表下,模式噪声分别约占总体系统噪声的63%、62%和61%。在第五部分,我们将介绍其他一些研究,特别是有关人事决策的研究,其研究的结果都与这一暂时性的结论一致。

在这些研究中,水平噪声通常不是系统噪声的最主要成分。这一事实已经传递了一则非常重要的信息,因为水平噪声是唯一一种(有时)无须组织进行噪声审查就可以监测到的噪声。当案例或多或少地被随机分配给各个专业人员时,他们的决策的平均差异就是水平噪声。例如,针对专利局的研究发现,审查员授予专利的平均倾向性存在很大差异,进而影响了有关这些专利的诉讼发生率。同样,儿童保护部门的官员决定将儿童送到寄养家庭或寄养机构的倾向性也不同,这会对儿童的命运产生长期影响。这些观测都仅仅基于水平噪声的评估。这些研究揭示的噪声问题令人震惊,但是,如果模式噪声多于水平噪声,那么它所反映的噪声问题的严重性至多只是实际情况的一半。这一暂时性结论也有例外。法官在关于是否提供庇护的裁决中出成分的大小:稳定的模式噪声几乎是水平噪声的4倍之多

首先,我们对水平噪声和模式噪声的相对权重进行了几种估算。总体而言,模式噪声似乎比水平噪声对系统噪声的影响更大。例如,在第2章提到的保险公司的例子中,不同核保人在平均保费上的差异仅占总体系统噪声的20%,剩余的80%都是模式噪声。在第6章提到的美国联邦法官的例子中,水平噪声(平均严厉程度的差异)在总体系统噪声中的占比略低于一半,而模式噪声则占一半以上。在惩罚性损害赔偿的实验中,系统噪声的总量在不同量表(惩罚倾向、愤怒程度或赔偿金额)上差别较大,但模式噪声的占比却基本恒定:三种量表下,模式噪声分别约占总体系统噪声的63%、62%和61%。在第五部分,我们将介绍其他一些研究,特别是有关人事决策的研究,其研究的结果都与这一暂时性的结论一致。

在这些研究中,水平噪声通常不是系统噪声的最主要成分。这一事实已经传递了一则非常重要的信息,因为水平噪声是唯一一种(有时)无须组织进行噪声审查就可以监测到的噪声。当案例或多或少地被随机分配给各个专业人员时,他们的决策的平均差异就是水平噪声。例如,针对专利局的研究发现,审查员授予专利的平均倾向性存在很大差异,进而影响了有关这些专利的诉讼发生率。同样,儿童保护部门的官员决定将儿童送到寄养家庭或寄养机构的倾向性也不同,这会对儿童的命运产生长期影响。这些观测都仅仅基于水平噪声的评估。这些研究揭示的噪声问题令人震惊,但是,如果模式噪声多于水平噪声,那么它所反映的噪声问题的严重性至多只是实际情况的一半。这一暂时性结论也有例外。法官在关于是否提供庇护的裁决中出现的令人震惊的巨大变异,几乎可以肯定更多地源自水平噪声,而非模式噪声,但我们怀疑其中的模式噪声也很多。

下一步,我们通过对模式噪声的两种成分进行分解来对其进行分析。我们有充分的理由认为,模式噪声的主要成分是稳定的模式噪声而非情境噪声。对美国联邦法官在量刑中存在的噪声进行审查,展示了我们的推理过程。我们首先假设了一种极端情况,即所有的模式噪声完全是随机变化的。在这一假设前提下,法官们的量刑会随着时间的推移变得十分不稳定和不一致,乃至达到毫无道理可言的程度。因此,我们不得不做出这样的推测:同一法官在不同情境中对同一案件量刑的平均差异达到2.8年左右。法官之间在平均量刑上的差异已经够令人震惊的了,要是同一名法官在不同情境下的量刑也存在这么大的差异,那实在是太荒唐了。因此,得出以下结论似乎更为合理:法官们会对不同的被告和不同的罪行做出有差异的反应,这种差异虽极为个体化,却是稳定的。

为了更加准确地量化模式噪声中有多少是稳定的模式噪声,又有多少是情境噪声,我们需要让同一名法官对每起案件进行两次独立评估。我们发现,在对判断的研究中通常不可能获得两个独立的判断,因为很难保证对案例的第二次判断完全独立于第一次判断。尤其是,当判断很复杂时,做出判断的人很可能会发现这是同一个问题,从而重复最初的判断。

亚历山大·托多罗夫(Alexader Todorov)带领普林斯顿大学的一组研究人员设计了一个巧妙的实验范式,攻克了这一难题。他们从(8)“亚马逊土耳其机器人”(Amazo Mechaical Turk)网上招募了参现的令人震惊的巨大变异,几乎可以肯定更多地源自水平噪声,而非模式噪声,但我们怀疑其中的模式噪声也很多。

下一步,我们通过对模式噪声的两种成分进行分解来对其进行分析。我们有充分的理由认为,模式噪声的主要成分是稳定的模式噪声而非情境噪声。对美国联邦法官在量刑中存在的噪声进行审查,展示了我们的推理过程。我们首先假设了一种极端情况,即所有的模式噪声完全是随机变化的。在这一假设前提下,法官们的量刑会随着时间的推移变得十分不稳定和不一致,乃至达到毫无道理可言的程度。因此,我们不得不做出这样的推测:同一法官在不同情境中对同一案件量刑的平均差异达到2.8年左右。法官之间在平均量刑上的差异已经够令人震惊的了,要是同一名法官在不同情境下的量刑也存在这么大的差异,那实在是太荒唐了。因此,得出以下结论似乎更为合理:法官们会对不同的被告和不同的罪行做出有差异的反应,这种差异虽极为个体化,却是稳定的。

为了更加准确地量化模式噪声中有多少是稳定的模式噪声,又有多少是情境噪声,我们需要让同一名法官对每起案件进行两次独立评估。我们发现,在对判断的研究中通常不可能获得两个独立的判断,因为很难保证对案例的第二次判断完全独立于第一次判断。尤其是,当判断很复杂时,做出判断的人很可能会发现这是同一个问题,从而重复最初的判断。

亚历山大·托多罗夫(Alexader Todorov)带领普林斯顿大学的一组研究人员设计了一个巧妙的实验范式,攻克了这一难题。他们从(8)“亚马逊土耳其机器人”(Amazo Mechaical Turk)网上招募了参与者。在他们的一项实验中,参与者观看了一些面孔图片(由计算机程序生成,但与真人面孔无异),并对这些面孔的各项属性进行了评分,比如亲和力、值得信赖程度等。一个星期后,实验人员用相同的面孔让相同的答卷人重复了该实验。

我们有理由认为,本实验中判断的一致性程度会低于专业人士的判断,如法官的量刑。虽然差不多每个人都会认同,有些面孔极具吸引力,有一些则令人反感,但在很大范围内,我们可以推测,对面孔的反应存在很大的个体差异。确实,观察者之间几乎没有共识。比如,在值得信赖程度的评分上,面孔图片之间的差异所导致的变异仅占判断变异的18%,剩余82%的变异都是噪声。

我们也有理由推测,这些判断的稳定性较差,因为实验参与者只是为了赚钱而参与在线答题,其判断品质会远低于专业判断。然而,实验结果发现,噪声的最主要成分还是稳定的模式噪声,其次才是水平噪声,即不同的观察者对诸如面孔值得信赖的程度等属性的平均评分上的差异。情境噪声虽然也很大,但占比最小。

要求参与者做出其他判断,比如有关汽车或食物的偏好,或是回答一些接近专业判断的问题时,研究人员也得出了相同的结论。比如,在第15章中讨论的惩罚性损害赔偿的一项模拟研究中,参与者针对10个人身伤害案件评定了他们的惩罚倾向,两次评分之间间隔一个星期。同样,稳定的模式噪声是噪声最主要的成分。在所有这些研究中,判断者给出的结果彼此不一致,但他们自身的判断仍保持稳定。用研究人员的话说,这种“缺乏共识的稳定性”,为稳定的模式噪声提供了清晰的证据。与者。在他们的一项实验中,参与者观看了一些面孔图片(由计算机程序生成,但与真人面孔无异),并对这些面孔的各项属性进行了评分,比如亲和力、值得信赖程度等。一个星期后,实验人员用相同的面孔让相同的答卷人重复了该实验。

我们有理由认为,本实验中判断的一致性程度会低于专业人士的判断,如法官的量刑。虽然差不多每个人都会认同,有些面孔极具吸引力,有一些则令人反感,但在很大范围内,我们可以推测,对面孔的反应存在很大的个体差异。确实,观察者之间几乎没有共识。比如,在值得信赖程度的评分上,面孔图片之间的差异所导致的变异仅占判断变异的18%,剩余82%的变异都是噪声。

我们也有理由推测,这些判断的稳定性较差,因为实验参与者只是为了赚钱而参与在线答题,其判断品质会远低于专业判断。然而,实验结果发现,噪声的最主要成分还是稳定的模式噪声,其次才是水平噪声,即不同的观察者对诸如面孔值得信赖的程度等属性的平均评分上的差异。情境噪声虽然也很大,但占比最小。

要求参与者做出其他判断,比如有关汽车或食物的偏好,或是回答一些接近专业判断的问题时,研究人员也得出了相同的结论。比如,在第15章中讨论的惩罚性损害赔偿的一项模拟研究中,参与者针对10个人身伤害案件评定了他们的惩罚倾向,两次评分之间间隔一个星期。同样,稳定的模式噪声是噪声最主要的成分。在所有这些研究中,判断者给出的结果彼此不一致,但他们自身的判断仍保持稳定。用研究人员的话说,这种“缺乏共识的稳定性”,为稳定的模式噪声提供了清晰的证据。关于稳定的模式噪声所起作用的最有力证据,来自我们在第10章中提到的对保释法官的大规模研究。在这项杰出研究的一个部分中,研究者创建了一个统计模型,该模型可以模拟每位法官如何使用手头的线索来决定是否批准被告的保释申请。他们建立了173名法官的个性化模型,然后运用这些模型来模拟法官对141 833个案例做出的判决,每个案例产生了173个判决——判决总数超过2400万。应我们的要求,研究者慷慨地进行了特定分析,他们将判断的变异分为三部分:每个案例平均决策的“真实”变异、法官们在保释倾向上表现出的差异所导致的水平噪声,以及剩下的模式噪声。

这一分析的结果与我们的观点相符,因为该研究所测得的模式噪声完全是稳定的。这项研究是对预测法官决策的模型进行的分析,因而无法体现情境噪声的随机变异性。这些数据仅包含可验证的、稳定的个体预测规则。

结论非常明确:稳定的模式噪声几乎是水平噪声的4倍——稳定的模式噪声占总变异的26%,而水平噪声占总变异的7%。这种可识别、稳定、特异性的个体模式,要比不同法官之间审判的严格程度的差异大得多。

所有这些证据与我们在第7章中讨论的有关情境噪声的研究结果一致:尽管情境噪声的存在让人惊讶甚至不安,但没有迹象表明个体内部的变异大于个体间的变异。系统噪声中最主要的成分恰恰是最开始被我们忽略的成分——稳定的模式噪声,即法官们对特定案例做出的判决中的变异性。关于稳定的模式噪声所起作用的最有力证据,来自我们在第10章中提到的对保释法官的大规模研究。在这项杰出研究的一个部分中,研究者创建了一个统计模型,该模型可以模拟每位法官如何使用手头的线索来决定是否批准被告的保释申请。他们建立了173名法官的个性化模型,然后运用这些模型来模拟法官对141 833个案例做出的判决,每个案例产生了173个判决——判决总数超过2400万。应我们的要求,研究者慷慨地进行了特定分析,他们将判断的变异分为三部分:每个案例平均决策的“真实”变异、法官们在保释倾向上表现出的差异所导致的水平噪声,以及剩下的模式噪声。

这一分析的结果与我们的观点相符,因为该研究所测得的模式噪声完全是稳定的。这项研究是对预测法官决策的模型进行的分析,因而无法体现情境噪声的随机变异性。这些数据仅包含可验证的、稳定的个体预测规则。

结论非常明确:稳定的模式噪声几乎是水平噪声的4倍——稳定的模式噪声占总变异的26%,而水平噪声占总变异的7%。这种可识别、稳定、特异性的个体模式,要比不同法官之间审判的严格程度的差异大得多。

所有这些证据与我们在第7章中讨论的有关情境噪声的研究结果一致:尽管情境噪声的存在让人惊讶甚至不安,但没有迹象表明个体内部的变异大于个体间的变异。系统噪声中最主要的成分恰恰是最开始被我们忽略的成分——稳定的模式噪声,即法官们对特定案例做出的判决中的变异性。

声明:部分内容来自互联网,如侵权请联系删除!
友情:思诺速记

相关推荐

管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2022-12-06
②附加价值:不仅客户本身价值体验很好,而且你给了他额外的偏好,给了他自己都没有想到的一些东西,他觉得留在这里是一个非常有价值的选择,而且他觉得要持续跟你保持这份链接。③成交策略:整个成交的环节、流程、节点、促销方案等,都是能不能截流非常重要的点。④付款方式:有的客户可能喜欢一次性付款,有的喜欢分期付款,也有的客户需要先有免费体验,我们可以通过部分免费体验,或
管理类 / 日期:2022-12-06
税改革后内资转换为外资的概率是否下降。如果确实下降,那就说明内资的所有制转换在一定程度上就是为了“税收套利”。首先,对于第一个环节,即增值税改革前后税差如何变化。在表7-8中,前两列中的被解释变量分别是内资与非HMK外资和HMK资的增值税税差,关键解释变量是虚拟变量“改革2004”,其取值为1时需要同时满足以下三个条件:(1)企业所在城市经历了增值税改革;(

推荐列表

热门标签