而不是用单点估计值来描述他们倾向于选择更......《噪声》摘录

管理类 日期 2022-06-29
而不是用单点估计值来描述,他们倾向于选择更窄的区间,而实际上这样做并不合理。例如,一项正在进行的季度调查要求美国一些公司的首席财务官估计下一年标准普尔500指数的年回报率。首席财务官们要提供两个数字:一个是最小值,即他们认为实际回报率有1/10的可能性低于该值;一个是最大值,即他们认为实际回报率有1/10的可能性高于该值。这两个数值的置信区间是80%。然而,事实上实际回报率落入这个区间的可能性只有36%,也就是说,首席财务官们对自己预测的准确性过于自信了。

预测者也充满噪声。J.斯科特·阿姆斯特朗(J. Scott Armstrog)在《预测原理》(Priciples of Forecastig)中指出,即使在专家中,“不可靠性也是判断预测的误差来源之一”。事实上,噪声是误差的主要来源。情境噪声很普遍:预测者自己的观点也并不总是前后一致。人与人之间的噪声也很普遍:预测者之间意见不一致,即便他们都是专家。如果让法学教授预测最高法院的裁决,你会发现大量的噪声。如果请相关专家预测实行空气污染管理制度的年度效益,你会发现巨大差异,例如从30亿美元到90亿美元不等。如果你让一群经济学家对失业率和经济增长情况做出预测,你也会发现他们的预测之间存在很大的差异。我们已经看到了许多存在噪声的关于预测的例子,而对预测的研究可以揭示更多问题。

改进预测的两种方法

研究也为减少噪声和偏差提供了建议。我们不会在此进行详尽描述,但会重点讨论两种广泛适用的减少噪声的策略。一种是应用我们而不是用单点估计值来描述,他们倾向于选择更窄的区间,而实际上这样做并不合理。例如,一项正在进行的季度调查要求美国一些公司的首席财务官估计下一年标准普尔500指数的年回报率。首席财务官们要提供两个数字:一个是最小值,即他们认为实际回报率有1/10的可能性低于该值;一个是最大值,即他们认为实际回报率有1/10的可能性高于该值。这两个数值的置信区间是80%。然而,事实上实际回报率落入这个区间的可能性只有36%,也就是说,首席财务官们对自己预测的准确性过于自信了。

预测者也充满噪声。J.斯科特·阿姆斯特朗(J. Scott Armstrog)在《预测原理》(Priciples of Forecastig)中指出,即使在专家中,“不可靠性也是判断预测的误差来源之一”。事实上,噪声是误差的主要来源。情境噪声很普遍:预测者自己的观点也并不总是前后一致。人与人之间的噪声也很普遍:预测者之间意见不一致,即便他们都是专家。如果让法学教授预测最高法院的裁决,你会发现大量的噪声。如果请相关专家预测实行空气污染管理制度的年度效益,你会发现巨大差异,例如从30亿美元到90亿美元不等。如果你让一群经济学家对失业率和经济增长情况做出预测,你也会发现他们的预测之间存在很大的差异。我们已经看到了许多存在噪声的关于预测的例子,而对预测的研究可以揭示更多问题。

改进预测的两种方法

研究也为减少噪声和偏差提供了建议。我们不会在此进行详尽描述,但会重点讨论两种广泛适用的减少噪声的策略。一种是应用我们在第18章提到的原则——选择更好的判断者,从而做出更好的判断;另一种是最普遍适用的决策卫生策略之一——汇总多项独立的评估结果。

对多个预测进行汇总的最简单方法是对它们取平均值。从数学的角度来看,平均值法能够保证减少噪声,具体地说,减少的量就是(1-判断总数平方根的倒数)。也就是说,如果你对100个判断取平均值,那么将减少90%的噪声,如果你对400个判断取平均值,则可以减少95%的噪声——基本上就消除噪声了。这一统计规律促使我们采用在第7章讨论过的群体智慧的方法。

由于平均值法不能减少偏差,对总体误差的影响取决于偏差和噪声的比例。这就是为什么当判断彼此独立时,群体智慧最有效,因为群体智慧中不太可能出现共同的偏差。大量实验证据表明,对多次预测取平均值会大大提高预测的准确性,例如在股票分析中,经济预测员的“共识”性预测最准确。就销售预测、天气预测和经济预测而言,一组预测者的未加权平均值优于大多数个体甚至所有个体的预测。而且,通过不同方法获得的平均预测具有相同的效果:在一个涵盖30项各领域的实证比较分析中,研究人员发现综合预测平均减少了12.5%的误差。

直接取平均值并不是对预测进行汇总的唯一方法。群体选择策略与直接取平均值的方法一样有效,即根据近期判断的准确性来选择最好的判断者,然后对少数判断者的判断取平均值。对尊重专家意见的决策者而言,他们更容易理解并采取一种既依赖于汇总又依赖于群体选择的策略。在第18章提到的原则——选择更好的判断者,从而做出更好的判断;另一种是最普遍适用的决策卫生策略之一——汇总多项独立的评估结果。

对多个预测进行汇总的最简单方法是对它们取平均值。从数学的角度来看,平均值法能够保证减少噪声,具体地说,减少的量就是(1-判断总数平方根的倒数)。也就是说,如果你对100个判断取平均值,那么将减少90%的噪声,如果你对400个判断取平均值,则可以减少95%的噪声——基本上就消除噪声了。这一统计规律促使我们采用在第7章讨论过的群体智慧的方法。

由于平均值法不能减少偏差,对总体误差的影响取决于偏差和噪声的比例。这就是为什么当判断彼此独立时,群体智慧最有效,因为群体智慧中不太可能出现共同的偏差。大量实验证据表明,对多次预测取平均值会大大提高预测的准确性,例如在股票分析中,经济预测员的“共识”性预测最准确。就销售预测、天气预测和经济预测而言,一组预测者的未加权平均值优于大多数个体甚至所有个体的预测。而且,通过不同方法获得的平均预测具有相同的效果:在一个涵盖30项各领域的实证比较分析中,研究人员发现综合预测平均减少了12.5%的误差。

直接取平均值并不是对预测进行汇总的唯一方法。群体选择策略与直接取平均值的方法一样有效,即根据近期判断的准确性来选择最好的判断者,然后对少数判断者的判断取平均值。对尊重专家意见的决策者而言,他们更容易理解并采取一种既依赖于汇总又依赖于群体选择的策略。产生汇总预测的一种方法是利用“预测市场”(predictio markets),在预测市场中,个体就各种可能的结果下注,从而得到激励来做出正确的预测。如果预测市场的价格表明某些事件发生的概率大约是70%,那么它们大约有70%的可能性会发生。从这个意义上说,大多数时候,预测市场的表现非常好。来自各个行业的许多公司都利用预测市场来汇总不同的观点。

另一个汇总不同观点的正式程序是德尔菲法(Delphi Method)。该方法的经典范式是一个包括多轮信息反馈的过程,在此过程中,参与者向组织者提交评估(或投票),并且彼此保持匿名。在新的一轮中,参与者都会给出自己评估的理由,并对其他人给出的理由做出回应,这个过程仍然是匿名的。这一过程鼓励估计值趋同(有时要求新的判断值落在前一轮判断分布的特定范围内,从而迫使估计值趋同)。这种方法能够同时从汇总和社会学习中获益。

德尔菲法在很多情况下都很好用,但是实施起来有一定的挑战性。有一个更简单的版本可以在单个会议中实施,那就是“迷你德尔菲法”。这个方法也被称为“评估-讨论-评估法”(estimate-talk-estimate),它要求参与者首先给出独立的(未公开的)评估,然后进行解释,并说明理由,最后根据其他人的评估和解释做出新的评估。共识性判断是第二轮中获得的个体估计的平均值。

良好判断计划的4个步骤

关于预测质量的一些最具创新性的研究超出了目前为止我们所探产生汇总预测的一种方法是利用“预测市场”(predictio markets),在预测市场中,个体就各种可能的结果下注,从而得到激励来做出正确的预测。如果预测市场的价格表明某些事件发生的概率大约是70%,那么它们大约有70%的可能性会发生。从这个意义上说,大多数时候,预测市场的表现非常好。来自各个行业的许多公司都利用预测市场来汇总不同的观点。

另一个汇总不同观点的正式程序是德尔菲法(Delphi Method)。该方法的经典范式是一个包括多轮信息反馈的过程,在此过程中,参与者向组织者提交评估(或投票),并且彼此保持匿名。在新的一轮中,参与者都会给出自己评估的理由,并对其他人给出的理由做出回应,这个过程仍然是匿名的。这一过程鼓励估计值趋同(有时要求新的判断值落在前一轮判断分布的特定范围内,从而迫使估计值趋同)。这种方法能够同时从汇总和社会学习中获益。

德尔菲法在很多情况下都很好用,但是实施起来有一定的挑战性。有一个更简单的版本可以在单个会议中实施,那就是“迷你德尔菲法”。这个方法也被称为“评估-讨论-评估法”(estimate-talk-estimate),它要求参与者首先给出独立的(未公开的)评估,然后进行解释,并说明理由,最后根据其他人的评估和解释做出新的评估。共识性判断是第二轮中获得的个体估计的平均值。

良好判断计划的4个步骤

关于预测质量的一些最具创新性的研究超出了目前为止我们所探讨的内容。这些研究始于2011年,当时3位知名的行为科学家创立了“良好判断计划”(Good Judgmet Project)。菲利普·泰特洛克(我们在第11章讨论过他对政治事件长期预测的评估)、他的妻子芭芭拉·梅勒斯以及唐·穆尔(Do Moore)联手提升我们对预测,特别是对为什么有些人擅长预测的理解。

良好判断计划首先招募了数以万计的志愿者,这些志愿者并非专家,而是来自各行各业的普通人。他们被要求回答数百个问题,例如:

· 印度或巴西是否会在未来两年内成为联合国安全理事会常任理事国?

· 在接下来的一年内会有国家脱欧吗?

从上述例子中我们可以看出,该计划主要关注国际大事。重要的是,回答这些问题引发了许多与日常生活更贴近的预测问题。比如一位律师被问到客户是否会胜诉,或是一个电视工作室被问到某个节目提案是否会大受欢迎,这些问题就涉及了预测技巧。泰特洛克和他的同事想知道是否有人尤其擅长预测,预测的能力能否习得或得到提高。

为了理解这些核心发现,我们需要解释一下泰特洛克和他的团队评估预测者时所采用方法的一些关键点。首先,他们使用的预测问题数量很大,而不只是一个或几个,因为那样的话,成功或失败可能全凭运气。如果你预测你最喜欢的队伍将赢得下一场比赛,而且它确实赢了,你也不一定是一个好的预测者。也许你总是预测你最喜欢的队伍会赢,如果这是你的策略,而他们只赢了一半的比赛,那么你的预讨的内容。这些研究始于2011年,当时3位知名的行为科学家创立了“良好判断计划”(Good Judgmet Project)。菲利普·泰特洛克(我们在第11章讨论过他对政治事件长期预测的评估)、他的妻子芭芭拉·梅勒斯以及唐·穆尔(Do Moore)联手提升我们对预测,特别是对为什么有些人擅长预测的理解。

良好判断计划首先招募了数以万计的志愿者,这些志愿者并非专家,而是来自各行各业的普通人。他们被要求回答数百个问题,例如:

· 印度或巴西是否会在未来两年内成为联合国安全理事会常任理事国?

· 在接下来的一年内会有国家脱欧吗?

从上述例子中我们可以看出,该计划主要关注国际大事。重要的是,回答这些问题引发了许多与日常生活更贴近的预测问题。比如一位律师被问到客户是否会胜诉,或是一个电视工作室被问到某个节目提案是否会大受欢迎,这些问题就涉及了预测技巧。泰特洛克和他的同事想知道是否有人尤其擅长预测,预测的能力能否习得或得到提高。

为了理解这些核心发现,我们需要解释一下泰特洛克和他的团队评估预测者时所采用方法的一些关键点。首先,他们使用的预测问题数量很大,而不只是一个或几个,因为那样的话,成功或失败可能全凭运气。如果你预测你最喜欢的队伍将赢得下一场比赛,而且它确实赢了,你也不一定是一个好的预测者。也许你总是预测你最喜欢的队伍会赢,如果这是你的策略,而他们只赢了一半的比赛,那么你的预测能力就不能算是特别厉害。基于这方面的考虑,为了减少运气的作用,研究人员验证了参与者在大量预测中的平均表现。

其次,研究人员要求参与者对事件发生的概率进行预测,而不是仅仅给出“会发生”或“不会发生”这种非此即彼的答案。对许多人来说,预测就是做是非题——站这方或者站那方。然而,考虑到我们在客观上对未来事件是无法知晓的,预测它们发生的概率才是更明智的选择。如果有人在2016年说“希拉里·克林顿有70%的可能性当选总统”,那他不一定是个糟糕的预测者。确切地说,有70%的概率会发生的事情仍然存在30%的不会发生的可能性。要知道预测者的水平高低,我们应该看他们估计的概率是否符合现实。假设一位名叫玛格丽特的预测者说,500个不同的事件发生的可能性为60%,结果其中300个真的发生了,那么我们就可以得出结论:玛格丽特的置信度被校准得很好。良好的校准是良好预测的前提之一。

再次,泰特洛克及其同事又对实验进行了改进,他们不仅要求预测者对一个事件是否会在12个月内发生做出一个概率估计,还让预测者根据新的信息不断修改自己的预测。假设你在2016年曾估计,英国在2019年底前脱欧的可能性只有30%,后来,新的民意调查结果显示,“脱欧”的选票持续增加,这时,你很可能会把你的预测值提高。公投结果公布后,我们仍然无法确定英国是否会在公布的时间内脱欧,但看起来可能性肯定会大得多。(事实上,英国已在2020年正式脱欧。)

泰特洛克和他的同事允许预测者根据新出现的信息更新预测,为了便于记分,他们把每次更新都视为一个新的预测。通过这种方式,测能力就不能算是特别厉害。基于这方面的考虑,为了减少运气的作用,研究人员验证了参与者在大量预测中的平均表现。

其次,研究人员要求参与者对事件发生的概率进行预测,而不是仅仅给出“会发生”或“不会发生”这种非此即彼的答案。对许多人来说,预测就是做是非题——站这方或者站那方。然而,考虑到我们在客观上对未来事件是无法知晓的,预测它们发生的概率才是更明智的选择。如果有人在2016年说“希拉里·克林顿有70%的可能性当选总统”,那他不一定是个糟糕的预测者。确切地说,有70%的概率会发生的事情仍然存在30%的不会发生的可能性。要知道预测者的水平高低,我们应该看他们估计的概率是否符合现实。假设一位名叫玛格丽特的预测者说,500个不同的事件发生的可能性为60%,结果其中300个真的发生了,那么我们就可以得出结论:玛格丽特的置信度被校准得很好。良好的校准是良好预测的前提之一。

再次,泰特洛克及其同事又对实验进行了改进,他们不仅要求预测者对一个事件是否会在12个月内发生做出一个概率估计,还让预测者根据新的信息不断修改自己的预测。假设你在2016年曾估计,英国在2019年底前脱欧的可能性只有30%,后来,新的民意调查结果显示,“脱欧”的选票持续增加,这时,你很可能会把你的预测值提高。公投结果公布后,我们仍然无法确定英国是否会在公布的时间内脱欧,但看起来可能性肯定会大得多。(事实上,英国已在2020年正式脱欧。)

泰特洛克和他的同事允许预测者根据新出现的信息更新预测,为了便于记分,他们把每次更新都视为一个新的预测。通过这种方式,

声明:部分内容来自互联网,如侵权请联系删除!
友情:思诺速记

相关推荐

管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2022-06-29
④掌握一些生活常用的本地语言外派员工有可能被派到一些母语并非英语的国家,比如泰国讲泰语、巴西讲葡萄牙语、秘鲁讲西班牙语、印尼讲印尼语等,在这些国家,很多人都只会讲当地语言,只有一小部分人会讲英语,而且很不标准或不流利。在这些国家,走出办公室,也许你要面对的就是普罗大众,你的英语很难派上用场,所以外派员工要学会一些本地语言,能听能讲一些基本词汇与简单的句子,才
管理类 / 日期:2022-06-29
在这么多要求中,根据经营品类的项目不同,勘查的主要方向会有差别,以热食类制品门店为例:如果门店没有冷食和自制饮品类,或者生食海鲜类产品,那么主要勘查的就是一、二、三、四、七类项目;如果有需要专间制作的项目品类,那就要增加上五、六两条了。当然进行实地勘查的另外一个目的是检验之前提交的资料与门店的实际情况是否有出入,比如经营面积、生产布局。如果在工作人员实地勘查

推荐列表

热门标签