消除噪声判断中存在噪声但判断模型中没有人......《噪声》摘录

管理类 日期 2022-08-27
· 消除噪声

判断中存在噪声,但判断模型中没有

· 人们往往相信自己的判断能更好地考虑问题的复杂性和微妙的细节,但复杂性和微妙的细节基本上没什么用,因为它们并不会提升简单模型的准确性。

· 在保罗·梅尔的书出版60多年后的今天,机械性预测优于人类的判断这一观点仍然令人震惊。

· 判断中有很多噪声,因此无噪声的判断模型会做出更准确的预测。· 消除噪声

判断中存在噪声,但判断模型中没有

· 人们往往相信自己的判断能更好地考虑问题的复杂性和微妙的细节,但复杂性和微妙的细节基本上没什么用,因为它们并不会提升简单模型的准确性。

· 在保罗·梅尔的书出版60多年后的今天,机械性预测优于人类的判断这一观点仍然令人震惊。

· 判断中有很多噪声,因此无噪声的判断模型会做出更准确的预测。第10章

无噪声的规则

近年来,人工智能(Artificial Itelligece)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些嫌疑人更可能在保释期逃脱;评估儿童保护部门接到的哪些电话更紧急,并需要工作人员上门访视。

尽管如今我们一听到“算法”一词,首先想到的是上面这些应用,但这个词还有更广泛的含义。在词典中,算法的定义是:在解决计算或其他问题时(尤其是借助计算机)所遵循的步骤或规则。根据这一定义,我们在上一章中所描述的简单模型和其他形式的机械性判断也属于算法。

事实上,从简单的规则到最复杂且难以理解的机器学习算法,许多机械性方法都可以胜过人类的判断。机械性方法之所以有这种出色第10章

无噪声的规则

近年来,人工智能(Artificial Itelligece)特别是机器学习技术让机器能够执行许多以前只有人类才能执行的任务。机器学习算法可以承担人脸识别、语言翻译、分析医学影像等任务,并且可以以惊人的速度和准确性来处理计算问题,例如为成千上万名驾驶员迅速规划行车路线。它们还可以执行困难的预测任务:预测美国最高法院的判决;识别哪些嫌疑人更可能在保释期逃脱;评估儿童保护部门接到的哪些电话更紧急,并需要工作人员上门访视。

尽管如今我们一听到“算法”一词,首先想到的是上面这些应用,但这个词还有更广泛的含义。在词典中,算法的定义是:在解决计算或其他问题时(尤其是借助计算机)所遵循的步骤或规则。根据这一定义,我们在上一章中所描述的简单模型和其他形式的机械性判断也属于算法。

事实上,从简单的规则到最复杂且难以理解的机器学习算法,许多机械性方法都可以胜过人类的判断。机械性方法之所以有这种出色表现,一个关键原因可能是所有机械性方法均无噪声,尽管这不是唯一的原因。

为了研究不同类型的基于规则的方法,并了解每种方法为何以及在何种条件下更有价值,我们从第9章的基于多元回归的简单模型(即线性回归模型)开始我们的旅程。由此出发,我们将在复杂性频谱上朝着两个相反的方向前进,首先从极端简捷的一端开始,然后朝着逐渐复杂的方向前进(见图10-1)。

图10-1 4类规则和算法的相对复杂性

简捷:稳定之美

罗宾·道斯(Roby Dawes)是20世纪六七十年代美国俄勒冈州尤金市研究人类判断行为的团队中的另一位明星成员。1974年,道斯在简化预测任务方面取得了突破。他的研究思路令人惊讶:他建议不要使用多元回归模型来确定每个预测因素的精确权重,而应给所有预测因素分配均等的权重。

道斯将均等权重的公式定义为“非最适线性模型(improper liear model)。他出人意料地发现,这些均等权重模型(equal-weight models)的准确性与合适的回归模型差不多,且远胜于诊断性判断。表现,一个关键原因可能是所有机械性方法均无噪声,尽管这不是唯一的原因。

为了研究不同类型的基于规则的方法,并了解每种方法为何以及在何种条件下更有价值,我们从第9章的基于多元回归的简单模型(即线性回归模型)开始我们的旅程。由此出发,我们将在复杂性频谱上朝着两个相反的方向前进,首先从极端简捷的一端开始,然后朝着逐渐复杂的方向前进(见图10-1)。

图10-1 4类规则和算法的相对复杂性

简捷:稳定之美

罗宾·道斯(Roby Dawes)是20世纪六七十年代美国俄勒冈州尤金市研究人类判断行为的团队中的另一位明星成员。1974年,道斯在简化预测任务方面取得了突破。他的研究思路令人惊讶:他建议不要使用多元回归模型来确定每个预测因素的精确权重,而应给所有预测因素分配均等的权重。

道斯将均等权重的公式定义为“非最适线性模型(improper liear model)。他出人意料地发现,这些均等权重模型(equal-weight models)的准确性与合适的回归模型差不多,且远胜于诊断性判断。连“并非最合适的模型”的支持者也承认,这种说法是不可信的,并且与统计直觉相悖。的确,道斯及其助手伯纳德·科里根(Berard Corriga)最初曾努力将论文发表在学术期刊上,但是编辑们根本不认同。如果回顾一下上一章中的莫妮卡和娜塔莉的例子,你就会相信某些预测因素比其他预测因素更重要。例如,相比于职业技能,大多数人会给予领导力更高的权重。因此,简单的未加权平均值怎么可能比精细加权的平均值或专家判断更好地预测一个人的表现呢?

在道斯取得研究突破多年后的今天,人们已经很熟悉这种令其同时代人惊讶的统计现象。正如前文所解释的那样,多元回归模型计算出了最佳权重,从而使均方误差最小化,而多元回归使原始数据中的误差最小化,因此,公式会自行调整以便预测数据中的每个偶然因素。例如,如果样本中包含一些具有较高职业技能但是由于不相关原因而表现异常出色的经理,该模型就将增加职业技能的权重。

这其中的挑战是:当将公式应用于样本之外时,也就是用它预测不同数据集的结果时,这些权重将不再是最优的。原始样本中的偶然因素不再存在,因为它们是“偶然因素”。在新样本中,具有较高职业技能的经理并不会都表现出色,而且新样本中具有原公式无法预测的新因素。要衡量模型预测的准确性,正确的做法是观察它在新样本中的表现,也就是观察它的“交叉验证相关性”(cross-validated correlatio)。事实上,回归模型在原始样本上过于出色,因此交叉验证相关性的表现几乎总是比它在原始样本中的表现差。道斯和科里根在几种情况下对均等权重模型和多元回归模型(交叉验证后)进行连“并非最合适的模型”的支持者也承认,这种说法是不可信的,并且与统计直觉相悖。的确,道斯及其助手伯纳德·科里根(Berard Corriga)最初曾努力将论文发表在学术期刊上,但是编辑们根本不认同。如果回顾一下上一章中的莫妮卡和娜塔莉的例子,你就会相信某些预测因素比其他预测因素更重要。例如,相比于职业技能,大多数人会给予领导力更高的权重。因此,简单的未加权平均值怎么可能比精细加权的平均值或专家判断更好地预测一个人的表现呢?

在道斯取得研究突破多年后的今天,人们已经很熟悉这种令其同时代人惊讶的统计现象。正如前文所解释的那样,多元回归模型计算出了最佳权重,从而使均方误差最小化,而多元回归使原始数据中的误差最小化,因此,公式会自行调整以便预测数据中的每个偶然因素。例如,如果样本中包含一些具有较高职业技能但是由于不相关原因而表现异常出色的经理,该模型就将增加职业技能的权重。

这其中的挑战是:当将公式应用于样本之外时,也就是用它预测不同数据集的结果时,这些权重将不再是最优的。原始样本中的偶然因素不再存在,因为它们是“偶然因素”。在新样本中,具有较高职业技能的经理并不会都表现出色,而且新样本中具有原公式无法预测的新因素。要衡量模型预测的准确性,正确的做法是观察它在新样本中的表现,也就是观察它的“交叉验证相关性”(cross-validated correlatio)。事实上,回归模型在原始样本上过于出色,因此交叉验证相关性的表现几乎总是比它在原始样本中的表现差。道斯和科里根在几种情况下对均等权重模型和多元回归模型(交叉验证后)进行了比较。他们采用的一个案例就是预测伊利诺伊大学90名心理学研究生第一年的GPA,使用的是与学业成就相关的10个变量,如能力测试分数、大学成绩、各种同龄人评分(peer ratigs,如外向性)以及各种自评(如责任心)等。标准多元回归模型的预测相关系数为0.69,经过交叉验证后降至0.57(PC=69%);均等权重模型与第一年GPA预测的相关系数与此大致相同,为0.6(PC=71%)。许多其他研究也得到了相似的结果。

当原始样本较小时,经过交叉验证后,准确性会降低更多,因为小样本的偶然性多,变异性较大。道斯指出,社会科学研究中通常使用小样本,以致所谓的最佳权重的优势消失殆尽。正如统计学家霍华德·怀纳(Howard Waier)在一篇研究最适当权重估值的学术论文中所使用的副标题:它并不重要。用道斯的话说,“我们不需要比我们的测量更精确的模型”。均等权重模型之所以表现出色,是因为它不容易受样本中偶然因素的影响。

道斯的研究的直接理论成果值得广为人知:即使你缺少有关结果先前的数据,你也可以进行有效的统计预测,只需收集一些你认为与预测结果相关的预测因素即可。

假设你必须对已经在多个维度上获得评分的高管的绩效做出预测,如第9章中高管的例子所示。你相信这些评分有很强的预测力,但是你没有每个评分预测的准确性数据。你也不可能花费几年的时间来追踪大量管理人员的绩效情况,但是,你可以基于这7个评分的均等权重模型来做预测。那么,这个均等权重模型的预测效果如何呢?它与结果的相关系数将为0.25(PC=58%),远优于诊断性预测——了比较。他们采用的一个案例就是预测伊利诺伊大学90名心理学研究生第一年的GPA,使用的是与学业成就相关的10个变量,如能力测试分数、大学成绩、各种同龄人评分(peer ratigs,如外向性)以及各种自评(如责任心)等。标准多元回归模型的预测相关系数为0.69,经过交叉验证后降至0.57(PC=69%);均等权重模型与第一年GPA预测的相关系数与此大致相同,为0.6(PC=71%)。许多其他研究也得到了相似的结果。

当原始样本较小时,经过交叉验证后,准确性会降低更多,因为小样本的偶然性多,变异性较大。道斯指出,社会科学研究中通常使用小样本,以致所谓的最佳权重的优势消失殆尽。正如统计学家霍华德·怀纳(Howard Waier)在一篇研究最适当权重估值的学术论文中所使用的副标题:它并不重要。用道斯的话说,“我们不需要比我们的测量更精确的模型”。均等权重模型之所以表现出色,是因为它不容易受样本中偶然因素的影响。

道斯的研究的直接理论成果值得广为人知:即使你缺少有关结果先前的数据,你也可以进行有效的统计预测,只需收集一些你认为与预测结果相关的预测因素即可。

假设你必须对已经在多个维度上获得评分的高管的绩效做出预测,如第9章中高管的例子所示。你相信这些评分有很强的预测力,但是你没有每个评分预测的准确性数据。你也不可能花费几年的时间来追踪大量管理人员的绩效情况,但是,你可以基于这7个评分的均等权重模型来做预测。那么,这个均等权重模型的预测效果如何呢?它与结果的相关系数将为0.25(PC=58%),远优于诊断性预测——

声明:部分内容来自互联网,如侵权请联系删除!
友情:思诺速记

相关推荐

管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2022-08-27
表4-6 研发经理人才画像卡表4-6 研发经理人才画像卡表4-7 质量经理人才画像卡表4-7 质量经理人才画像卡表4-8 运营经理人才画像卡表4-8 运营经理人才画像卡表4-9 生产经理人才画像卡表4-9 生产经理人才画像卡
管理类 / 日期:2022-08-26
强在发展过程中对环境保护、技术创新等方面的重视,帮助企业规避政策和行业风险,不断提升绿色研发和创新能力,创造良好的环境和社会效益。多项实证研究表明,ESG投资可为投资者和企业带来正面影响。目前全球范围内,ESG的投资保持高速增长,投资规模已占全球总资产管理规模的三分之一。ESG投资的发展离不开监管方、资金方(Asset Ower)和资本市场的多方共同驱动,以

推荐列表

热门标签