相关系数为0.15(PC=55%),并且肯定与交叉验证后的回归模型非常相似,也不需要任何你没有的数据或任何复杂的计算。
用道斯的话说,均等权重模型具有“稳定之美”。研究判断的学生已对这句话达成共识。介绍这一观点的开创性文章的最后一句话给出了另一个精妙的总结:“应用均等权重模型所需的全部技巧是决定要关注哪些变量,并知道如何将这些变量进行叠加。”
更简捷:简约模型
另一种简化的方式是采用简约模型(frugal models)或简单规则。简约模型是对现实进行极端简化并无须复杂计算的模型,但在某些情况下,它们可以产生令人惊叹的预测效果。
令很多人感到惊讶的是,这些模型是基于多元回归的一个特征建立的。假设你使用了两个准确性很高的预测因素,它们与结果的相关系数分别为0.6(PC=71%)和0.55(PC=69%),且这两个预测因素彼此相关,相关系数为0.5。当将这两个预测因素进行最佳组合时,预测的准确性会有多好呢?答案令人失望,相关系数是0.67(PC=73%),这个结果比之前好,但并没有好太多。
该示例说明了一条一般性规则:将两个或多个相关预测因素组合后,预测效果相比于单个预测因素并不会好多少。因为在现实生活中,预测因素几乎总是相关的,所以这一统计事实支持使用包含少量预测因素的简约模型进行预测。与使用很多预测因素的模型相比,简单规则只需少量计算或根本无须计算,就能在某些情况下达到令人吃惊的相关系数为0.15(PC=55%),并且肯定与交叉验证后的回归模型非常相似,也不需要任何你没有的数据或任何复杂的计算。
用道斯的话说,均等权重模型具有“稳定之美”。研究判断的学生已对这句话达成共识。介绍这一观点的开创性文章的最后一句话给出了另一个精妙的总结:“应用均等权重模型所需的全部技巧是决定要关注哪些变量,并知道如何将这些变量进行叠加。”
更简捷:简约模型
另一种简化的方式是采用简约模型(frugal models)或简单规则。简约模型是对现实进行极端简化并无须复杂计算的模型,但在某些情况下,它们可以产生令人惊叹的预测效果。
令很多人感到惊讶的是,这些模型是基于多元回归的一个特征建立的。假设你使用了两个准确性很高的预测因素,它们与结果的相关系数分别为0.6(PC=71%)和0.55(PC=69%),且这两个预测因素彼此相关,相关系数为0.5。当将这两个预测因素进行最佳组合时,预测的准确性会有多好呢?答案令人失望,相关系数是0.67(PC=73%),这个结果比之前好,但并没有好太多。
该示例说明了一条一般性规则:将两个或多个相关预测因素组合后,预测效果相比于单个预测因素并不会好多少。因为在现实生活中,预测因素几乎总是相关的,所以这一统计事实支持使用包含少量预测因素的简约模型进行预测。与使用很多预测因素的模型相比,简单规则只需少量计算或根本无须计算,就能在某些情况下达到令人吃惊的预测效果。
一个研究团队于2020年发表了一项研究成果。他们将简约模型应用于一系列现实问题,内容包括在案件待审期间法官是否该批准被告的保释申请。这项决策隐含着对被告行为的预测,如果错误地拒绝保释,被告将被不必要地拘押,从而对个人和社会造成巨大损失;如果错误地批准保释,则被告可能在受审前逃脱,甚至犯下其他罪行。
研究人员仅使用两个可高度预测被告在保释期逃脱可能性的已知变量来建立模型:被告的年龄(年龄越大,逃脱风险较低)和未按时出庭受审的次数(有未按时出庭受审记录的人,更可能逃脱)。该模型将这两个变量转换为一系列分数,并针对风险进行评分,在计算被告保释期逃脱的风险时无须使用计算机,甚至不需要计算器。
当用真实数据来测试时,该简约模型的表现与那些使用众多变量的统计模型一样好,而在预测逃脱风险方面,简约模型比几乎所有法官的判断都要好。同样的简约模型采用少数几个整数(-3~+3)对最多5个特征进行评分,并以此来对各种任务进行预测,如基于乳房X线片判断肿瘤的严重程度、诊断心脏病、预测信用风险等。在所有这些任务中,简约模型的表现都与复杂回归模型一样好,只不过它通常不如机器学习模型的表现好。
另一项研究也证明了简约模型的有效性。另外一个研究小组研究了一个与上述案例相似但有所不同的司法问题:预测惯犯。研究人员在评估被告再次犯罪的风险时,使用的模型只有两个输入变量,但该模型的预测效果与使用137个变量的模型相同。毫无疑问,这两个预预测效果。
一个研究团队于2020年发表了一项研究成果。他们将简约模型应用于一系列现实问题,内容包括在案件待审期间法官是否该批准被告的保释申请。这项决策隐含着对被告行为的预测,如果错误地拒绝保释,被告将被不必要地拘押,从而对个人和社会造成巨大损失;如果错误地批准保释,则被告可能在受审前逃脱,甚至犯下其他罪行。
研究人员仅使用两个可高度预测被告在保释期逃脱可能性的已知变量来建立模型:被告的年龄(年龄越大,逃脱风险较低)和未按时出庭受审的次数(有未按时出庭受审记录的人,更可能逃脱)。该模型将这两个变量转换为一系列分数,并针对风险进行评分,在计算被告保释期逃脱的风险时无须使用计算机,甚至不需要计算器。
当用真实数据来测试时,该简约模型的表现与那些使用众多变量的统计模型一样好,而在预测逃脱风险方面,简约模型比几乎所有法官的判断都要好。同样的简约模型采用少数几个整数(-3~+3)对最多5个特征进行评分,并以此来对各种任务进行预测,如基于乳房X线片判断肿瘤的严重程度、诊断心脏病、预测信用风险等。在所有这些任务中,简约模型的表现都与复杂回归模型一样好,只不过它通常不如机器学习模型的表现好。
另一项研究也证明了简约模型的有效性。另外一个研究小组研究了一个与上述案例相似但有所不同的司法问题:预测惯犯。研究人员在评估被告再次犯罪的风险时,使用的模型只有两个输入变量,但该模型的预测效果与使用137个变量的模型相同。毫无疑问,这两个预测因素(年龄和先前被定罪的次数)与保释模型中使用的两个因素密切相关,而大量证据表明,它们与犯罪行为也是紧密相关的。
简约模型的吸引力在于其透明性和易用性,而且相比于其他复杂模型,它只需略微牺牲一点准确性就能获得这些优势。
更复杂:机器学习
在旅程的第二部分,让我们在复杂性频谱上朝相反的方向前进。如果我们可以使用更多预测因素,收集更多数据,发现前人未发现的关系模式,并对这些模式进行建模以实现更好的预测效果,那会如何呢?从本质上讲,这就是人工智能的目的。
海量数据集对复杂分析至关重要。而获得此类数据集越来越容易,是近年来人工智能快速发展的主要原因之一。例如,大型数据集可以机械地处理“断腿的例外”(broke-leg exceptios)这种情况。这个有点神秘的短语可以追溯到前文中梅尔假想的一个示例:设想有这样一个模型,它可以预测人们今晚去看电影的可能性,无论你对该模型有多大信心,如果你碰巧知道某人刚摔断了腿,你都可能会比模型更准确地预测他今晚是否会去看电影。
在使用简单模型时,“断腿原则”给决策者提供了重要启示:它告诉人们何时需推翻模型,何时则不需要这样做。如果你掌握了模型未考虑的如“断腿”这样的决定性信息,你就应该推翻模型的建议。此外,即使你缺少此类信息,有时你也不会同意模型的建议。在这种情况下,你试图推翻模型的行为,反映了你对相同预测因素做出反应测因素(年龄和先前被定罪的次数)与保释模型中使用的两个因素密切相关,而大量证据表明,它们与犯罪行为也是紧密相关的。
简约模型的吸引力在于其透明性和易用性,而且相比于其他复杂模型,它只需略微牺牲一点准确性就能获得这些优势。
更复杂:机器学习
在旅程的第二部分,让我们在复杂性频谱上朝相反的方向前进。如果我们可以使用更多预测因素,收集更多数据,发现前人未发现的关系模式,并对这些模式进行建模以实现更好的预测效果,那会如何呢?从本质上讲,这就是人工智能的目的。
海量数据集对复杂分析至关重要。而获得此类数据集越来越容易,是近年来人工智能快速发展的主要原因之一。例如,大型数据集可以机械地处理“断腿的例外”(broke-leg exceptios)这种情况。这个有点神秘的短语可以追溯到前文中梅尔假想的一个示例:设想有这样一个模型,它可以预测人们今晚去看电影的可能性,无论你对该模型有多大信心,如果你碰巧知道某人刚摔断了腿,你都可能会比模型更准确地预测他今晚是否会去看电影。
在使用简单模型时,“断腿原则”给决策者提供了重要启示:它告诉人们何时需推翻模型,何时则不需要这样做。如果你掌握了模型未考虑的如“断腿”这样的决定性信息,你就应该推翻模型的建议。此外,即使你缺少此类信息,有时你也不会同意模型的建议。在这种情况下,你试图推翻模型的行为,反映了你对相同预测因素做出反应的个人模式。这种个人模式很可能是无效的,你的干预可能会降低预测的准确性,因此你应该避免推翻模型。
机器学习模型之所以能够在预测方面表现出色,其中一个原因就是,它们能够发现人类所无法想象的各种“断腿”情况。在具有大量案例、海量数据的条件下,追踪观影行为的模型真的会学习,例如在固定观影日去了医院的人当晚不太可能去看电影。可以说,以这种方式改进对不常见事件的预测,可减少对人工监督的需求。
人工智能不是魔法,也不需要理解什么,它仅仅是在识别模式。虽然我们必须佩服机器学习的力量,但我们也要明白,人工智能可能要花很长时间才能理解为什么断腿之人会错过电影之夜。
更明智的保释决策
在前面提到的研究团队将简单规则应用于保释决策问题的同时,(6)由塞德希尔·穆来纳森(Sedhil Mullaiatha)领导的另一个团队训练了复杂的人工智能模型来执行相同的任务。研究团队获得了更大的数据集——包含758 027个保释裁定的案例库。对于每种情况,研究团队可以获得和法官一样的信息:被告的罪行、犯罪记录、未按时出庭受审的次数等。除年龄外,参与训练的算法没有其他任何人口统计学信息适合使用。对于每一起案件,研究人员还知道关于被告是否被释放,以及他如果被释放,之后是否会按时出庭或被重新逮捕(被告中有74%的人获得保释,其中15%的人在那之后没有按时出庭,26%的人则被重新逮捕)的信息。研究人员利用这一数据来训练一个的个人模式。这种个人模式很可能是无效的,你的干预可能会降低预测的准确性,因此你应该避免推翻模型。
机器学习模型之所以能够在预测方面表现出色,其中一个原因就是,它们能够发现人类所无法想象的各种“断腿”情况。在具有大量案例、海量数据的条件下,追踪观影行为的模型真的会学习,例如在固定观影日去了医院的人当晚不太可能去看电影。可以说,以这种方式改进对不常见事件的预测,可减少对人工监督的需求。
人工智能不是魔法,也不需要理解什么,它仅仅是在识别模式。虽然我们必须佩服机器学习的力量,但我们也要明白,人工智能可能要花很长时间才能理解为什么断腿之人会错过电影之夜。
更明智的保释决策
在前面提到的研究团队将简单规则应用于保释决策问题的同时,(6)由塞德希尔·穆来纳森(Sedhil Mullaiatha)领导的另一个团队训练了复杂的人工智能模型来执行相同的任务。研究团队获得了更大的数据集——包含758 027个保释裁定的案例库。对于每种情况,研究团队可以获得和法官一样的信息:被告的罪行、犯罪记录、未按时出庭受审的次数等。除年龄外,参与训练的算法没有其他任何人口统计学信息适合使用。对于每一起案件,研究人员还知道关于被告是否被释放,以及他如果被释放,之后是否会按时出庭或被重新逮捕(被告中有74%的人获得保释,其中15%的人在那之后没有按时出庭,26%的人则被重新逮捕)的信息。研究人员利用这一数据来训练一个机器学习算法,并评估了该算法的表现。该模型是通过机器学习构建的,因此并不限于线性组合。如果它在数据中检测到更复杂的规律,它就会使用此模式来改进预测。
该模型用于预测嫌疑人在保释期逃脱的风险,因此将风险量化为数字,而非只产生是否准予保释的决定。这种方法确定了最大可接受风险的阈值,即如果风险高于该阈值,就应该拒绝保释。然而,研究人员发现,无论如何设置风险阈值,使用该模型的预测得分都高于法官的预测。穆来纳森的团队计算得出,如果将风险阈值设置为一个值,使模型预测的拒绝保释人数与法官判决的拒绝保释人数相同,则犯罪率最多可降低24%,个中原因在于,被关押的人最有可能再次犯罪。相反,如果将风险阈值设置为使该模型在不提高犯罪率的情况下,尽可能减少被拒绝保释的人数,则研究人员计算得出,被羁押的人数最多可再减少42%。换句话说,机器学习模型在预测哪些被告属于犯罪高风险人群方面,表现要比法官好得多。
利用机器学习建立的模型,也比使用相同信息的线性模型成功得多,原因很有趣:机器学习算法在变量组合中发现了一些会被线性模型遗漏的重要信息。算法能对风险最高的被告进行归类,就证明它有能力找到很容易被其他模型忽略的模式。换句话说,数据中的某些模式尽管很少见,却非常准确地预测出了高风险人群。利用算法找到罕见但具有决定性作用的模式,让我们想起了“断腿”的概念。
研究人员还使用该算法为每位法官构建了模型,类似于我们在第9章中描述的判断模型(但不限于简单线性组合)。他们将这些模型应用于整个数据集,使团队能够模拟法官在遇到相同案件时可能做出机器学习算法,并评估了该算法的表现。该模型是通过机器学习构建的,因此并不限于线性组合。如果它在数据中检测到更复杂的规律,它就会使用此模式来改进预测。
该模型用于预测嫌疑人在保释期逃脱的风险,因此将风险量化为数字,而非只产生是否准予保释的决定。这种方法确定了最大可接受风险的阈值,即如果风险高于该阈值,就应该拒绝保释。然而,研究人员发现,无论如何设置风险阈值,使用该模型的预测得分都高于法官的预测。穆来纳森的团队计算得出,如果将风险阈值设置为一个值,使模型预测的拒绝保释人数与法官判决的拒绝保释人数相同,则犯罪率最多可降低24%,个中原因在于,被关押的人最有可能再次犯罪。相反,如果将风险阈值设置为使该模型在不提高犯罪率的情况下,尽可能减少被拒绝保释的人数,则研究人员计算得出,被羁押的人数最多可再减少42%。换句话说,机器学习模型在预测哪些被告属于犯罪高风险人群方面,表现要比法官好得多。
利用机器学习建立的模型,也比使用相同信息的线性模型成功得多,原因很有趣:机器学习算法在变量组合中发现了一些会被线性模型遗漏的重要信息。算法能对风险最高的被告进行归类,就证明它有能力找到很容易被其他模型忽略的模式。换句话说,数据中的某些模式尽管很少见,却非常准确地预测出了高风险人群。利用算法找到罕见但具有决定性作用的模式,让我们想起了“断腿”的概念。
研究人员还使用该算法为每位法官构建了模型,类似于我们在第9章中描述的判断模型(但不限于简单线性组合)。他们将这些模型应用于整个数据集,使团队能够模拟法官在遇到相同案件时可能做出
管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2023-04-29
(1)患者抽血、CT/MR等待时间长,患者满意度低(容易引起投诉)。(2)医嘱合格率不高,医务沟通费时费力。(3)出院流程烦琐,影响入院、出院,平均住院日降不下来。(4)化验单开错,标本合格率下降,TAT达标率上不去。(5)住院患者错误服药,影响患者安全。(6)手术器械遗失或者配套不及时,影响手术,影响患者安全。(7)药库、药房等各类仓库面积不够用,无法满足
管理类 / 日期:2023-04-29
企业管理人员以往的工作模式是遇到一个问题,立刻跟上级反馈,向领导请教解决问题的方法。这时管理人员就变成传声筒,没有自己的思想,也不能主动承担责任,自己解决问题。由于管理人员长期只会简单地传递信息,无法为企业运营管理制定有效的策略,更无法对员工进行科学的指挥,这样的管理者对于企业的价值可以说微乎其微。当我们运用数字化业绩改善会模式后,管理者的工作模式就有了本质