和机械性预测进行比较。二者都具有如下一些简单的结构:
· 用一组预测因素(如案例中对候选人的评分)来预测目标结果(如候选人的工作绩效)。
· 利用人类的判断做出诊断性预测。
· 基于某项规则(如多元回归),使用同一组预测因素来生成机械性预测的结果。
· 比较诊断性预测与机械性预测的整体准确性。
梅尔:最优模型击败了你
在了解诊断性预测和机械性预测之后,人们往往想知道两者之间的区别,即相比于公式,人类的判断会更优吗?
这个问题早已有人提出过,但是直到1954年,明尼苏达大学心理学教授保罗·梅尔(Paul Meehl)出版了《临床与统计预测:理论分析和证据综述》(Cliical Versus Statistical Predictio: A Theoretical Aalysis ad a Review of the Evidece)一书后,该问题才引起了人们的广泛关注。梅尔回顾了20项研究,并根据一系列研究结果(如学业成就和精神病预后效果)分析了诊断性判断和机械性判断的优劣。他得出了一个强有力的结论:简单的机械性规则普遍优于人类的判断。梅尔发现,临床医生和其他专业人员在整合信息的能力上表现极差,虽然他们自认为在这方面具有优势。和机械性预测进行比较。二者都具有如下一些简单的结构:
· 用一组预测因素(如案例中对候选人的评分)来预测目标结果(如候选人的工作绩效)。
· 利用人类的判断做出诊断性预测。
· 基于某项规则(如多元回归),使用同一组预测因素来生成机械性预测的结果。
· 比较诊断性预测与机械性预测的整体准确性。
梅尔:最优模型击败了你
在了解诊断性预测和机械性预测之后,人们往往想知道两者之间的区别,即相比于公式,人类的判断会更优吗?
这个问题早已有人提出过,但是直到1954年,明尼苏达大学心理学教授保罗·梅尔(Paul Meehl)出版了《临床与统计预测:理论分析和证据综述》(Cliical Versus Statistical Predictio: A Theoretical Aalysis ad a Review of the Evidece)一书后,该问题才引起了人们的广泛关注。梅尔回顾了20项研究,并根据一系列研究结果(如学业成就和精神病预后效果)分析了诊断性判断和机械性判断的优劣。他得出了一个强有力的结论:简单的机械性规则普遍优于人类的判断。梅尔发现,临床医生和其他专业人员在整合信息的能力上表现极差,虽然他们自认为在这方面具有优势。为了更好地理解上述发现为何如此令人惊讶,以及它与噪声的关系,我们需要明白简单的机械性预测模型是如何工作的。机械性预测最关键的特征是:它的预测规则适用于所有情况。每个预测因素都有特定的权重,这个权重不会因个案的不同而发生变化。你可能会认为,这种严格的约束会使模型比不上人类的判断,比如,在上文的例子里,也许你会认为莫妮卡的应聘动机和职业技能相结合是一项重要优势,能弥补她在其他方面的不足;也许你还认为,考虑到娜塔莉的其他长处,她在这两方面的劣势没什么大不了。也就是说,你会不由自主地设想她们两人不同的成功途径。凭借这些看似合理的诊断性推测,你针对两人的情况,对不同的预测因素赋予了不同的权重,而简单模型不存在这样的问题。
简单模型的另一个限制是,预测因素每增加1个单位,总是会产生相同大小的效果,即如果增加2个单位,那么所产生的效果是前者的2倍,而诊断性直觉经常与这一原则相悖。例如,娜塔莉的沟通能力是满分10分,如果你对此印象深刻,认为此分数值得你提高对其沟通能力的预测权重,那么你所做的就是简单模型所不能做到的。在加权平均公式中,得分10和9之间的差异与得分7和6之间的差异是相同的,但诊断性判断往往不遵循这一原则,相反,它反映了一种普遍性的直觉,即相同的差异在一种情况下可能无关紧要,在另一种情况下却可能非常重要。因此,我们认为没有哪个简单模型可以完整地描述你对莫妮卡和娜塔莉所做出的判断。
本文使用的例子就是梅尔模式的一个典型案例。正如我们所指出的那样,诊断性预测与工作绩效之间的相关系数仅为为了更好地理解上述发现为何如此令人惊讶,以及它与噪声的关系,我们需要明白简单的机械性预测模型是如何工作的。机械性预测最关键的特征是:它的预测规则适用于所有情况。每个预测因素都有特定的权重,这个权重不会因个案的不同而发生变化。你可能会认为,这种严格的约束会使模型比不上人类的判断,比如,在上文的例子里,也许你会认为莫妮卡的应聘动机和职业技能相结合是一项重要优势,能弥补她在其他方面的不足;也许你还认为,考虑到娜塔莉的其他长处,她在这两方面的劣势没什么大不了。也就是说,你会不由自主地设想她们两人不同的成功途径。凭借这些看似合理的诊断性推测,你针对两人的情况,对不同的预测因素赋予了不同的权重,而简单模型不存在这样的问题。
简单模型的另一个限制是,预测因素每增加1个单位,总是会产生相同大小的效果,即如果增加2个单位,那么所产生的效果是前者的2倍,而诊断性直觉经常与这一原则相悖。例如,娜塔莉的沟通能力是满分10分,如果你对此印象深刻,认为此分数值得你提高对其沟通能力的预测权重,那么你所做的就是简单模型所不能做到的。在加权平均公式中,得分10和9之间的差异与得分7和6之间的差异是相同的,但诊断性判断往往不遵循这一原则,相反,它反映了一种普遍性的直觉,即相同的差异在一种情况下可能无关紧要,在另一种情况下却可能非常重要。因此,我们认为没有哪个简单模型可以完整地描述你对莫妮卡和娜塔莉所做出的判断。
本文使用的例子就是梅尔模式的一个典型案例。正如我们所指出的那样,诊断性预测与工作绩效之间的相关系数仅为0.15(PC=55%),而机械性预测获得的相关系数为0.3(PC=60%)。再回忆一下你在莫妮卡和娜塔莉的例子中对她们的优点所持有的信心。梅尔的结果强烈表明,你对自己判断品质的满意感只是一种错觉,即“效度错觉”(illusio of validity)。
人们做出预测性判断时总会出现效度错觉,因为我们无法区分预测性任务的两个不同阶段:对当前证据的评估阶段和对实际结果的预测阶段。如果要评估两名候选人哪个看起来更好,你通常会充满信心,但是这跟猜测哪名候选人实际上更好完全是两码事。比如,你可以胸有成竹地说“娜塔莉看起来是比莫妮卡更优秀的候选人”,但是,如果要断言娜塔莉将成为一位比莫妮卡更成功的经理,则要冒很大的风险,原因很明显:评估两名候选人所需要的大部分信息你都是知道的,但要想预测未来,就存在很大的不确定性。
然而,我们的思维对上述差别的感受是模糊不清的,事实上,几乎每个人都对二者的差别感到困惑。但是,如果你做出预测时表现出的自信与你进行案例评估时一样,那么你就产生了效度错觉。
即使是临床医生也无法避免效度错觉。梅尔的研究发现,最简单的公式,只要持续应用,竟然可以胜过医学专家的临床判断。你肯定能想象到临床心理学家对此做何反应,他们会感到震惊、怀疑,甚至会鄙视这种对神奇的临床直觉假装进行的肤浅研究。这种反应很容易理解,梅尔的发现与人类判断的主观经验相矛盾,大多数人都更相信自己的经验而非学者的主张。
梅尔本人对自己的发现也持模棱两可的态度,因为一提到他的名0.15(PC=55%),而机械性预测获得的相关系数为0.3(PC=60%)。再回忆一下你在莫妮卡和娜塔莉的例子中对她们的优点所持有的信心。梅尔的结果强烈表明,你对自己判断品质的满意感只是一种错觉,即“效度错觉”(illusio of validity)。
人们做出预测性判断时总会出现效度错觉,因为我们无法区分预测性任务的两个不同阶段:对当前证据的评估阶段和对实际结果的预测阶段。如果要评估两名候选人哪个看起来更好,你通常会充满信心,但是这跟猜测哪名候选人实际上更好完全是两码事。比如,你可以胸有成竹地说“娜塔莉看起来是比莫妮卡更优秀的候选人”,但是,如果要断言娜塔莉将成为一位比莫妮卡更成功的经理,则要冒很大的风险,原因很明显:评估两名候选人所需要的大部分信息你都是知道的,但要想预测未来,就存在很大的不确定性。
然而,我们的思维对上述差别的感受是模糊不清的,事实上,几乎每个人都对二者的差别感到困惑。但是,如果你做出预测时表现出的自信与你进行案例评估时一样,那么你就产生了效度错觉。
即使是临床医生也无法避免效度错觉。梅尔的研究发现,最简单的公式,只要持续应用,竟然可以胜过医学专家的临床判断。你肯定能想象到临床心理学家对此做何反应,他们会感到震惊、怀疑,甚至会鄙视这种对神奇的临床直觉假装进行的肤浅研究。这种反应很容易理解,梅尔的发现与人类判断的主观经验相矛盾,大多数人都更相信自己的经验而非学者的主张。
梅尔本人对自己的发现也持模棱两可的态度,因为一提到他的名字,我们就会想起“统计优于诊断性判断”这一论断,我们可能把他想象成人类洞察力的无情批判者,或者是“量化分析之父”,但事实并非如此。梅尔不仅是一位学术研究人员,还是一位有着丰富临床经验的精神分析师,他的办公室里挂着心理学家弗洛伊德的照片。同时,他也是一个多才多艺的人,不仅教授心理学课程,还教授哲学和法律学课程,他还撰写了一些有关形而上学、宗教学、政治学甚至超心理学(parapsychology)的文章。这些特征都不符合一个刻薄的数据狂人的形象。梅尔对临床医生并没有恶意,但是正如他所说,存在“大量且一致”的证据表明:采用机械性的方法来整合意见会更具优势。
“大量且一致”是个不偏不倚的表述。一篇发表于2000年的论文对136项研究进行了回顾,清晰地表明机械性整合确实优于诊断性判断。这篇论文涵盖的研究主题广泛,包括对黄疸的诊断、军人的身体素质测评和婚姻满意度调查等,其中,63项研究表明机械性预测更准确;65项研究表明两者难分伯仲;8项研究表明诊断性预测更好。以上结果可能还低估了机械性预测的优势,因为机械性预测比诊断性预测速度更快、成本更低。此外,在许多此类研究中,人类在判断时还具有不对等的优势,因为他们可以获取未提供给计算机模型的“私人”信息。这些发现都支持了一个显而易见的结论:简单模型的决策优于人类判断。
戈德堡:你的判断模型击败了你
梅尔的发现引出了一些重要的问题:公式到底为什么会更优?模型在哪些方面可以做得更好?事实上,一个更好的问题是:为什么人字,我们就会想起“统计优于诊断性判断”这一论断,我们可能把他想象成人类洞察力的无情批判者,或者是“量化分析之父”,但事实并非如此。梅尔不仅是一位学术研究人员,还是一位有着丰富临床经验的精神分析师,他的办公室里挂着心理学家弗洛伊德的照片。同时,他也是一个多才多艺的人,不仅教授心理学课程,还教授哲学和法律学课程,他还撰写了一些有关形而上学、宗教学、政治学甚至超心理学(parapsychology)的文章。这些特征都不符合一个刻薄的数据狂人的形象。梅尔对临床医生并没有恶意,但是正如他所说,存在“大量且一致”的证据表明:采用机械性的方法来整合意见会更具优势。
“大量且一致”是个不偏不倚的表述。一篇发表于2000年的论文对136项研究进行了回顾,清晰地表明机械性整合确实优于诊断性判断。这篇论文涵盖的研究主题广泛,包括对黄疸的诊断、军人的身体素质测评和婚姻满意度调查等,其中,63项研究表明机械性预测更准确;65项研究表明两者难分伯仲;8项研究表明诊断性预测更好。以上结果可能还低估了机械性预测的优势,因为机械性预测比诊断性预测速度更快、成本更低。此外,在许多此类研究中,人类在判断时还具有不对等的优势,因为他们可以获取未提供给计算机模型的“私人”信息。这些发现都支持了一个显而易见的结论:简单模型的决策优于人类判断。
戈德堡:你的判断模型击败了你
梅尔的发现引出了一些重要的问题:公式到底为什么会更优?模型在哪些方面可以做得更好?事实上,一个更好的问题是:为什么人类做出的判断很差?答案是:人类在许多方面都不如统计模型,其中一个主要弱点在于人类的判断过程存在噪声。
为了支持这一结论,我们来看另一项关于简单模型的研究,该研究始于美国俄勒冈州的小城市尤金(Eugee)。保罗·霍夫曼(Paul Hoffma)是一位富有且有远见的心理学家,他对当时的学术环境颇为不满,因此,他成立了一家研究所,招募了一批非常得力的研究人员,这使尤金市成为著名的人类判断行为研究重镇。
其中有一位名叫刘易斯·戈德堡(Lewis Goldberg)的研究人员,他因在“大五人格模型”的基础上发展出了“领导力角色模型”而闻名于世。在20世纪60年代后期,戈德堡基于霍夫曼的早期工作,开始研究用于描述个体判断行为的统计模型。
建立这样一个判断模型和建立一个“现实模型”(model of reality)一样简单,因为两者所使用的预测因素完全相同。与我们最初的例子一样,预测因素是高管在工作绩效的5个维度上的得分,使用的工具也是多元回归。不同的是,该公式并非用于预测候选人的实际绩效,而是用于预测人的判断,比如你对莫妮卡、娜塔莉和其他高管候选人的判断。
用加权平均的方式对你的判断进行建模,可能看起来有些奇怪,因为你的判断并不是这样形成的。当你评价莫妮卡和娜塔莉的工作绩效时,你并没有采用这种规则,事实上,你可能没有采用任何规则。总之,判断模型并非描述实际判断过程的模型。
然而,即使你在实际判断过程中并未基于线性公式去运算,你的类做出的判断很差?答案是:人类在许多方面都不如统计模型,其中一个主要弱点在于人类的判断过程存在噪声。
为了支持这一结论,我们来看另一项关于简单模型的研究,该研究始于美国俄勒冈州的小城市尤金(Eugee)。保罗·霍夫曼(Paul Hoffma)是一位富有且有远见的心理学家,他对当时的学术环境颇为不满,因此,他成立了一家研究所,招募了一批非常得力的研究人员,这使尤金市成为著名的人类判断行为研究重镇。
其中有一位名叫刘易斯·戈德堡(Lewis Goldberg)的研究人员,他因在“大五人格模型”的基础上发展出了“领导力角色模型”而闻名于世。在20世纪60年代后期,戈德堡基于霍夫曼的早期工作,开始研究用于描述个体判断行为的统计模型。
建立这样一个判断模型和建立一个“现实模型”(model of reality)一样简单,因为两者所使用的预测因素完全相同。与我们最初的例子一样,预测因素是高管在工作绩效的5个维度上的得分,使用的工具也是多元回归。不同的是,该公式并非用于预测候选人的实际绩效,而是用于预测人的判断,比如你对莫妮卡、娜塔莉和其他高管候选人的判断。
用加权平均的方式对你的判断进行建模,可能看起来有些奇怪,因为你的判断并不是这样形成的。当你评价莫妮卡和娜塔莉的工作绩效时,你并没有采用这种规则,事实上,你可能没有采用任何规则。总之,判断模型并非描述实际判断过程的模型。
然而,即使你在实际判断过程中并未基于线性公式去运算,你的
管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2022-04-09
程”将人才源源不断输送至各工作模块。三、人才发展链:人才组织同发展人才供应链只解决了“量”的问题,“质”的提升也是需要关注的重心。单纯依靠人才自发自主的学习,可能无法满足企业成长的人才诉求,还需要构建人才组织同发展的管理体系,以组织需求推动人才成长,以能力成长换来发展空间和薪酬回报,实现双赢。人才发展链的主要目的是把战略目标和人才发展目标结合起来,通过人才“
管理类 / 日期:2022-04-09
过多的经验要求现今社会处于一个极速变化的环境中,即所谓的“VUCA”时代,业绩与过去经验的相关性不再显著。招聘中若设置了过多经验要求,一方面会缩小喇叭口导致可选范围变窄,另一方面,大部分经验可通过培养和学习在较短的时间内弥补,这样的条件便显得不必要。现如今,各行各业都在强调创新,很多全新的产品和服务模式出现,直接影响现代人的生活方式,创造了巨大的收益。那些对