判断结果仍可能像是使用了线性公式一般比如......《噪声》摘录

管理类 日期 2023-01-29
判断结果仍可能像是使用了线性公式一般。比如,台球专家们在描述某一杆如何进球时,表现得就好像他们解开了复杂的方程一样,然而实际上他们并未真的那样做。同理,你做出的预测就好像使用了简单公式一样,然而实际上你所做的要复杂得多。对于一个假设模型来说,即使它对过程的描述存在明显的错误,但只要该模型可以合理准确地预测人们的行为,那么它也是很有用的。简单模型就是这样的假设模型。一项针对判断研究的报告全面回顾了237项研究,发现判断模型和诊断性判断的平均相关系数为0.8(PC=79%),尽管不是完全相关,但这种相关性已经足以支持所谓的“假设”理论了。

戈德堡的研究想要解决的问题是:简单的判断模型预测实际结果的效果究竟如何?由于该模型只是对判断者的一个粗略的模拟,因此我们可以合理地假定它的预测效果不佳。那么,用模型替代判断者时,会损失多少准确性呢?答案可能会让你大吃一惊。当我们依据模型做出预测时,预测的准确性并没有降低,相反,在大多数情况下,判断模型反而表现更优,该模型甚至优于专业人士的预测。我们或许可以这样来理解:替代品竟然比真品更好用。

这一结论已被许多领域的研究所证实。早期一项关于预测学生毕业成绩的研究证实了戈德堡的结论。研究人员要求98名参与者基于10条线索预测90名学生的GPA。研究人员根据这些预测,为每名参与者做出的判断建立了一个线性模型,并比较了参与者本人和模型预测的准确性。结果发现,对于这98名参与者来说,模型都比他们本人的预测更准确!几十年后,一项对近50年研究成果的综述性研究也得出了同样的结论:判断模型的表现一如既往地胜过判断者本人。判断结果仍可能像是使用了线性公式一般。比如,台球专家们在描述某一杆如何进球时,表现得就好像他们解开了复杂的方程一样,然而实际上他们并未真的那样做。同理,你做出的预测就好像使用了简单公式一样,然而实际上你所做的要复杂得多。对于一个假设模型来说,即使它对过程的描述存在明显的错误,但只要该模型可以合理准确地预测人们的行为,那么它也是很有用的。简单模型就是这样的假设模型。一项针对判断研究的报告全面回顾了237项研究,发现判断模型和诊断性判断的平均相关系数为0.8(PC=79%),尽管不是完全相关,但这种相关性已经足以支持所谓的“假设”理论了。

戈德堡的研究想要解决的问题是:简单的判断模型预测实际结果的效果究竟如何?由于该模型只是对判断者的一个粗略的模拟,因此我们可以合理地假定它的预测效果不佳。那么,用模型替代判断者时,会损失多少准确性呢?答案可能会让你大吃一惊。当我们依据模型做出预测时,预测的准确性并没有降低,相反,在大多数情况下,判断模型反而表现更优,该模型甚至优于专业人士的预测。我们或许可以这样来理解:替代品竟然比真品更好用。

这一结论已被许多领域的研究所证实。早期一项关于预测学生毕业成绩的研究证实了戈德堡的结论。研究人员要求98名参与者基于10条线索预测90名学生的GPA。研究人员根据这些预测,为每名参与者做出的判断建立了一个线性模型,并比较了参与者本人和模型预测的准确性。结果发现,对于这98名参与者来说,模型都比他们本人的预测更准确!几十年后,一项对近50年研究成果的综述性研究也得出了同样的结论:判断模型的表现一如既往地胜过判断者本人。我们不知道这些研究中的参与者是否收到了有关个人表现的反馈,但是,如果有人告诉你,对你的判断进行粗略建模后的模型实际上比你本人预测得更准确(这极具讽刺性),想必你会感到非常沮丧。对于大多数人来说,判断活动是复杂、丰富且有趣的,这也恰恰是因为它不符合简单规则。当我们发明并应用一些复杂规则来做判断或对某些案例有了不同于其他案例的见解时,即当我们做出了无法用简单的加权求和模型去简化的判断时,我们会自我感觉更加良好,对自己的判断能力更加信心十足。但关于判断模型的研究进一步证实了梅尔的结论——很多细节都是无用的,复杂性和丰富性并不会使预测更准确。

为什么会这样呢?要了解戈德堡的发现,我们需要了解是什么导致你的实际判断与预测这些判断的简单模型之间有了差异。

基于你的判断建立起来的统计模型,不可能将所有用于判断的信息都纳入其中,模型能做的只是抽象和简化。尤其是,你的简单模型不会将你一直遵循的任何复杂规则表征出来。比如,你可能会认为沟通能力评分为10分和9分之间的差别要比7分和6分之间的差别更大,或认为在所有维度上得分均为7分的候选人比平均分相同但优势和劣势都更加明显的候选人更优秀,然而你的模型并不会表征这些复杂规则,即使你经常使用这些规则。

如果你的复杂规则行之有效,那么简单模型会因为不能重复你的规则而导致自身的预测力下降。例如,假设你必须从一个人的技能和动机两个方面来预测他成功完成一项困难任务的可能性,那么加权平均并非好方法,因为动机再强,也无法弥补能力的不足,反之亦然。我们不知道这些研究中的参与者是否收到了有关个人表现的反馈,但是,如果有人告诉你,对你的判断进行粗略建模后的模型实际上比你本人预测得更准确(这极具讽刺性),想必你会感到非常沮丧。对于大多数人来说,判断活动是复杂、丰富且有趣的,这也恰恰是因为它不符合简单规则。当我们发明并应用一些复杂规则来做判断或对某些案例有了不同于其他案例的见解时,即当我们做出了无法用简单的加权求和模型去简化的判断时,我们会自我感觉更加良好,对自己的判断能力更加信心十足。但关于判断模型的研究进一步证实了梅尔的结论——很多细节都是无用的,复杂性和丰富性并不会使预测更准确。

为什么会这样呢?要了解戈德堡的发现,我们需要了解是什么导致你的实际判断与预测这些判断的简单模型之间有了差异。

基于你的判断建立起来的统计模型,不可能将所有用于判断的信息都纳入其中,模型能做的只是抽象和简化。尤其是,你的简单模型不会将你一直遵循的任何复杂规则表征出来。比如,你可能会认为沟通能力评分为10分和9分之间的差别要比7分和6分之间的差别更大,或认为在所有维度上得分均为7分的候选人比平均分相同但优势和劣势都更加明显的候选人更优秀,然而你的模型并不会表征这些复杂规则,即使你经常使用这些规则。

如果你的复杂规则行之有效,那么简单模型会因为不能重复你的规则而导致自身的预测力下降。例如,假设你必须从一个人的技能和动机两个方面来预测他成功完成一项困难任务的可能性,那么加权平均并非好方法,因为动机再强,也无法弥补能力的不足,反之亦然。如果你使用复杂的预测规则,那么你的预测准确性将比无法获取复杂规则的简单模型更高。但复杂规则通常只会给你带来效度错觉,这实际上会降低你的判断品质。也就是说,少数复杂规则是有效的,但大多数是无效的。

此外,你的简单模型并不会表征你在判断中的噪声,它不能重现你在特定案例中由于随机反应而产生的正误差或负误差。同理,你在做出特定判断时会受到当时的环境和心理状态的影响,而模型并不会。这些判断的噪声带来的误差很可能与任何事物都不相关,这意味着在大多数情况下,我们可以将其视为随机误差。

从你的判断中消除噪声通常会提高你的预测准确性。例如,假设你的预测与结果的相关系数是0.5(PC=67%),此时你的判断中包含了50%由噪声导致的变异,而如果你的判断没有噪声,那么它们与结果的相关系数将提升至0.71(PC=75%)。由此可见,用机器减少噪声可以提高预测判断的有效性。

简而言之,用模型代替人类的判断意味着两件事:消除了人类的复杂规则,消除了噪声。判断模型比判断更有效这一强有力的发现说明:从人类判断的复杂规则中获得的好处(如果存在的话)不足以补偿噪声所带来的损失。你可能会认为自己比一般人更擅长思考、更有洞察力,但实际上只是你的噪声更多而已。

为什么我们以为复杂的规则更有效,实际上它们却损害了判断的准确性呢?一方面,人们发明的许多复杂规则并不正确;另一方面,即使复杂规则在原则上是有效的,它们也不可避免地仅适用于少数能如果你使用复杂的预测规则,那么你的预测准确性将比无法获取复杂规则的简单模型更高。但复杂规则通常只会给你带来效度错觉,这实际上会降低你的判断品质。也就是说,少数复杂规则是有效的,但大多数是无效的。

此外,你的简单模型并不会表征你在判断中的噪声,它不能重现你在特定案例中由于随机反应而产生的正误差或负误差。同理,你在做出特定判断时会受到当时的环境和心理状态的影响,而模型并不会。这些判断的噪声带来的误差很可能与任何事物都不相关,这意味着在大多数情况下,我们可以将其视为随机误差。

从你的判断中消除噪声通常会提高你的预测准确性。例如,假设你的预测与结果的相关系数是0.5(PC=67%),此时你的判断中包含了50%由噪声导致的变异,而如果你的判断没有噪声,那么它们与结果的相关系数将提升至0.71(PC=75%)。由此可见,用机器减少噪声可以提高预测判断的有效性。

简而言之,用模型代替人类的判断意味着两件事:消除了人类的复杂规则,消除了噪声。判断模型比判断更有效这一强有力的发现说明:从人类判断的复杂规则中获得的好处(如果存在的话)不足以补偿噪声所带来的损失。你可能会认为自己比一般人更擅长思考、更有洞察力,但实际上只是你的噪声更多而已。

为什么我们以为复杂的规则更有效,实际上它们却损害了判断的准确性呢?一方面,人们发明的许多复杂规则并不正确;另一方面,即使复杂规则在原则上是有效的,它们也不可避免地仅适用于少数能被观察到的情况。例如,假设你已经得出结论:对于一个独创性极高的候选人,即使他在其他方面得分一般,也值得被雇用。可问题在于,从定义上看,具有独创性的候选人总是很稀缺。既然对独创性的评估可能不可靠,在这一指标上得了高分的人就可能是侥幸,而真正具有独创性的人才往往无法被发现。即使在绩效评估中具有较高独创性的候选人最终真的表现得特别优秀,绩效评估本身也存在很多问题。两端的测量误差会不可避免地削弱预测的有效性,一些小概率事件尤其可能被忽略,复杂模型的优势很快就会被测量误差所掩盖。

马丁·于(Marti Yu)和内森·昆塞尔(Natha Kucel)报告了一项比戈德堡所做的更激进的研究。该研究基于莫妮卡和娜塔莉的案例,使用了一家跨国咨询公司的数据,这家跨国咨询公司聘请专家评估了3个独立样本中共847名高管职位的候选人。专家们在7个不同的评估维度上对这些候选人进行了评分,并使用他们的诊断性判断为每位候选人生成了一个预测总分,然而结果令人大吃一惊。

马丁·于和昆塞尔将判断结果与随机线性模型进行比较,而非与他们的最佳简单模型进行比较。他们为7个预测因素生成了10 000套随机权重,并应用了这10 000个随机公式来预测工作绩效。他们吃惊地发现,用任何线性模型来对所有案例进行预测,其结果均优于人类基于相同信息所做出的判断。在其中一个样本中,10 000个随机加权线性模型中有77%优于人类专家;在另外两个样本中,随机模型100%胜过人类专家。换句话说,该研究表明,所有简单模型的表现都比人类专家好。

这项研究得出的结论比我们从戈德堡的判断模型中得出的结论更被观察到的情况。例如,假设你已经得出结论:对于一个独创性极高的候选人,即使他在其他方面得分一般,也值得被雇用。可问题在于,从定义上看,具有独创性的候选人总是很稀缺。既然对独创性的评估可能不可靠,在这一指标上得了高分的人就可能是侥幸,而真正具有独创性的人才往往无法被发现。即使在绩效评估中具有较高独创性的候选人最终真的表现得特别优秀,绩效评估本身也存在很多问题。两端的测量误差会不可避免地削弱预测的有效性,一些小概率事件尤其可能被忽略,复杂模型的优势很快就会被测量误差所掩盖。

马丁·于(Marti Yu)和内森·昆塞尔(Natha Kucel)报告了一项比戈德堡所做的更激进的研究。该研究基于莫妮卡和娜塔莉的案例,使用了一家跨国咨询公司的数据,这家跨国咨询公司聘请专家评估了3个独立样本中共847名高管职位的候选人。专家们在7个不同的评估维度上对这些候选人进行了评分,并使用他们的诊断性判断为每位候选人生成了一个预测总分,然而结果令人大吃一惊。

马丁·于和昆塞尔将判断结果与随机线性模型进行比较,而非与他们的最佳简单模型进行比较。他们为7个预测因素生成了10 000套随机权重,并应用了这10 000个随机公式来预测工作绩效。他们吃惊地发现,用任何线性模型来对所有案例进行预测,其结果均优于人类基于相同信息所做出的判断。在其中一个样本中,10 000个随机加权线性模型中有77%优于人类专家;在另外两个样本中,随机模型100%胜过人类专家。换句话说,该研究表明,所有简单模型的表现都比人类专家好。

这项研究得出的结论比我们从戈德堡的判断模型中得出的结论更有力。事实上,这是个非常极端的例子。在这种情况下,人类的判断确实非常糟糕,这就解释了为什么即使是不尽如人意的线性模型,其表现也超越了人类判断。当然,我们并不能因此下结论说机器绝对比人强,尽管如此,机械地遵守简单规则(马丁·于和昆塞尔称其为“无意识的一致性”(midless cosistecy))可以显著提高针对困难问题所做判断的品质,这一事实说明了噪声对诊断性预测的巨大影响。

本章简要地说明了噪声对诊断性判断造成的负面影响。在预测性判断中,人类专家很容易被简单的公式所击败,其中包括真实模型、判断模型甚至随机生成的模型。这一发现支持我们使用无噪声的方法——规则和算法,这也是下一章的主题。有力。事实上,这是个非常极端的例子。在这种情况下,人类的判断确实非常糟糕,这就解释了为什么即使是不尽如人意的线性模型,其表现也超越了人类判断。当然,我们并不能因此下结论说机器绝对比人强,尽管如此,机械地遵守简单规则(马丁·于和昆塞尔称其为“无意识的一致性”(midless cosistecy))可以显著提高针对困难问题所做判断的品质,这一事实说明了噪声对诊断性预测的巨大影响。

本章简要地说明了噪声对诊断性判断造成的负面影响。在预测性判断中,人类专家很容易被简单的公式所击败,其中包括真实模型、判断模型甚至随机生成的模型。这一发现支持我们使用无噪声的方法——规则和算法,这也是下一章的主题。

声明:部分内容来自互联网,如侵权请联系删除!
友情:思诺速记

相关推荐

管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2023-01-29
第五章 高盈利五部曲之一:引流一、美业店铺引流的10种方式美业店铺的引流,也就是拓客,这是大家都特别关心的问题。在我看来,引流是最容易的,留客是最难的。引流的方式方法太多了,下面只介绍日常经营过程中最常用到的10种引流方式。第一,产品/项目架构。这是引流首先要考虑的第一点,却是很多人都忽视的。你有什么样的产品/项目架构就有什么样的客户,产品/项目架构决定了顾
管理类 / 日期:2023-01-29
倾听。不同时代人之间可能会有偏见,例如,反感看似“过时”或“无法容忍”的穿衣风格或打扮风格,就很难让这个求职者通过,所以要尽量专注于求职者的回答和举止。当然,偏见也会有相反的效果——你很喜欢这个迷人的求职者或他让你想起了你的好朋友,这和消极的偏见一样不可取。•用你的身体来倾听。不时地点头或微笑回应求职者的交流,表示你对求职者所说的话感兴趣。让肢体语言保持开放

推荐列表

热门标签