如何发现强化学习的机会
你如何判断自己是否忽视了强化学习可能解决的问题?以下就是
入手之处:
列出清单。创建包含一系列步骤的业务流程清单,并清楚地说明
你希望最大化或最小化的内容。关注行动密集、频繁且有反馈机会的
流程,避免罕有行动且难以观察到哪种行动最能有效收集反馈的流
程。找对目标可能需要反复演算。
考虑其他选择。如果你能用其他机器学习或优化技术来解决问题,
那就不要从强化学习开始。当缺乏足够的历史数据来训练算法时,强
化学习会很有帮助。您需要探索各种选择(并在此过程中创建数据)。
小心你的愿望。如果你真的想继续前进,领域专家应该与技术团
队紧密合作,帮助设计输入、行动和回报。对于输入,要寻找你可以
用来做出正确决策的最小信息集。对于行动,要询问你希望给予系统
多少灵活性;从简单行动开始,以后再扩大行动范围。对于回报,要
仔细考虑结果——要小心避免陷入孤立地考虑一个变量或者以长期
痛苦换取短期收益的陷阱。问问这样做是否值得。可能的收益是否可以证明发展成本的合理
性?许多企业需要进行数字化转型投资,以建立系统和密集的、生成
数据的业务流程,从而让强化学习系统真正发挥作用。为了回答投资
是否会有回报的问题,技术团队应该评估计算资源,以确保你拥有支如何发现强化学习的机会
你如何判断自己是否忽视了强化学习可能解决的问题?以下就是
入手之处:
列出清单。创建包含一系列步骤的业务流程清单,并清楚地说明
你希望最大化或最小化的内容。关注行动密集、频繁且有反馈机会的
流程,避免罕有行动且难以观察到哪种行动最能有效收集反馈的流
程。找对目标可能需要反复演算。
考虑其他选择。如果你能用其他机器学习或优化技术来解决问题,
那就不要从强化学习开始。当缺乏足够的历史数据来训练算法时,强
化学习会很有帮助。您需要探索各种选择(并在此过程中创建数据)。
小心你的愿望。如果你真的想继续前进,领域专家应该与技术团
队紧密合作,帮助设计输入、行动和回报。对于输入,要寻找你可以
用来做出正确决策的最小信息集。对于行动,要询问你希望给予系统
多少灵活性;从简单行动开始,以后再扩大行动范围。对于回报,要
仔细考虑结果——要小心避免陷入孤立地考虑一个变量或者以长期
痛苦换取短期收益的陷阱。问问这样做是否值得。可能的收益是否可以证明发展成本的合理
性?许多企业需要进行数字化转型投资,以建立系统和密集的、生成
数据的业务流程,从而让强化学习系统真正发挥作用。为了回答投资
是否会有回报的问题,技术团队应该评估计算资源,以确保你拥有支持试验所需的计算能力,并允许系统探索和确定最优排序。(他们可能希望在实时发布算法之前先创建一个模拟的环境来对其测试。)在
软件方面,如果你计划使用一个针对客户参与的学习系统,那你就需
要一个能够支持A/B测试的系统。这对学习过程至关重要,因为算法
需要探索不同的选择,然后才能确定哪一个选项最有效。最后,如果
你的技术堆栈只能普遍发布特性,那么你可能需要在升级之后再开始
优化。
做好耐心的准备。最后但同样重要的是,与许多学习算法一样,
在系统学习的早期,你必须对错误持开放态度。它不会从第一天起就
找到最佳路径,但它会适时实现目标——而在它真的实现目标的时
候,可能就会找到出乎人类想象的令人惊讶的创造性解决方案。
尽管强化学习是一项成熟的技术,但它现在才刚刚开始应用于商
业背景。当该技术用于自动化或优化生成密集数据的业务流程时,以
及在可能存在无法用公式或规则得出的意外变数时,它会有出色表
现。如果你能发现一个机会,而且要么依靠一个内部技术团队,要么
与该领域的专家合作,那你就有机会可以运用这项技术来超越你的竞
争对手。
凯瑟琳·休姆是加拿大皇家银行Borealis AI机器学习研究实验室的负责人。在加入Borealis之前,休姆博士在Itegrate.ai及Fast Forward Labs担任领导职务,帮助50多家《财富》500强企业开发并实施了人工智能项目。她曾在哈佛大学、麻省理工学院、多伦多大学和卡尔加里大学的商学院和法学院教授数字转型课程。马修·泰勒是艾伯塔大学计算科学副教授,他在该大学负责领导智能机器人学习实验室(Itelliget Robot LearigLab),是艾伯塔机器智能学院(the Alberta Machie Itelligece Istitute, Amii)的研究员及驻站研究员。他目前的研究兴趣包括强化学习的根本性改进、强化学习在现实世界中的应用以及人类-人工智能交互。他即将出版的新书《现实世界数据的强化学习应用》(Reiforcemet Learig Applicatios for Real-持试验所需的计算能力,并允许系统探索和确定最优排序。(他们可能希望在实时发布算法之前先创建一个模拟的环境来对其测试。)在
软件方面,如果你计划使用一个针对客户参与的学习系统,那你就需
要一个能够支持A/B测试的系统。这对学习过程至关重要,因为算法
需要探索不同的选择,然后才能确定哪一个选项最有效。最后,如果
你的技术堆栈只能普遍发布特性,那么你可能需要在升级之后再开始
优化。
做好耐心的准备。最后但同样重要的是,与许多学习算法一样,
在系统学习的早期,你必须对错误持开放态度。它不会从第一天起就
找到最佳路径,但它会适时实现目标——而在它真的实现目标的时
候,可能就会找到出乎人类想象的令人惊讶的创造性解决方案。
尽管强化学习是一项成熟的技术,但它现在才刚刚开始应用于商
业背景。当该技术用于自动化或优化生成密集数据的业务流程时,以
及在可能存在无法用公式或规则得出的意外变数时,它会有出色表
现。如果你能发现一个机会,而且要么依靠一个内部技术团队,要么
与该领域的专家合作,那你就有机会可以运用这项技术来超越你的竞
争对手。
凯瑟琳·休姆是加拿大皇家银行Borealis AI机器学习研究实验室的负责人。在加入Borealis之前,休姆博士在Itegrate.ai及Fast Forward Labs担任领导职务,帮助50多家《财富》500强企业开发并实施了人工智能项目。她曾在哈佛大学、麻省理工学院、多伦多大学和卡尔加里大学的商学院和法学院教授数字转型课程。马修·泰勒是艾伯塔大学计算科学副教授,他在该大学负责领导智能机器人学习实验室(Itelliget Robot LearigLab),是艾伯塔机器智能学院(the Alberta Machie Itelligece Istitute, Amii)的研究员及驻站研究员。他目前的研究兴趣包括强化学习的根本性改进、强化学习在现实世界中的应用以及人类-人工智能交互。他即将出版的新书《现实世界数据的强化学习应用》(Reiforcemet Learig Applicatios for Real-World Data)由奥斯本(Osbore)、辛格(Sigh)和泰勒共同撰写,其目标读者是没有机器学习学位的从业者,预计将在2021年秋季出版发行。World Data)由奥斯本(Osbore)、辛格(Sigh)和泰勒共同撰写,其目标读者是没有机器学习学位的从业者,预计将在2021年秋季出版发行。专栏
数字驱动助力
人才大战
孔良(Ko Leog,音译) | 文时青靖 | 编辑
麦肯锡公司(McKisey & Compay) 1997年造词以来就在媒体
上广为流传的所谓“人才大战(war for talet)”在后新冠疫情自时代正呈现出一种全新的含义。随着工作场所转向虚拟和混合
布局,以远程协作的方式松散地结合在一起,发现和留住人才的竞争
愈演愈烈。这种实体经营以外的扩张实质上废除了以往许多识别和培
养人才的做法,“走动式管理”再也行不通了。
与此同时,大量的新数据突然之间可以用来帮助企业回答有关其
员工队伍及其需求的关键问题。数字协作平台和数据采集新方法的兴
起,连同发现和管理人才的新技术和新方法,正在重新定义企业建设未来员工队伍的方式。
作为一家拥有大数据专业知识的信息管理公司,我们经常发现自
己正在实施新的方法,为更具创新精神的企业发现人才。作为一名不
断寻找人才的CEO,我亲眼目睹了数据如何能够将企业的招聘工作专栏
数字驱动助力
人才大战
孔良(Ko Leog,音译) | 文时青靖 | 编辑
麦肯锡公司(McKisey & Compay) 1997年造词以来就在媒体
上广为流传的所谓“人才大战(war for talet)”在后新冠疫情自时代正呈现出一种全新的含义。随着工作场所转向虚拟和混合
布局,以远程协作的方式松散地结合在一起,发现和留住人才的竞争
愈演愈烈。这种实体经营以外的扩张实质上废除了以往许多识别和培
养人才的做法,“走动式管理”再也行不通了。
与此同时,大量的新数据突然之间可以用来帮助企业回答有关其
员工队伍及其需求的关键问题。数字协作平台和数据采集新方法的兴
起,连同发现和管理人才的新技术和新方法,正在重新定义企业建设未来员工队伍的方式。
作为一家拥有大数据专业知识的信息管理公司,我们经常发现自
己正在实施新的方法,为更具创新精神的企业发现人才。作为一名不
断寻找人才的CEO,我亲眼目睹了数据如何能够将企业的招聘工作从典型的“基于直觉的方法”提升为使用有意义但易受忽略的指标而做出的基于证据的决策。本着照亮未来道路的精神,我已将我们的一
些关键见解汇编成了这种新的范式。
着眼其他地方之前,先在内部物色
虽然“打造”而不“购买”并非人才获取方面的一个新概念,但
固有的困难在于对各个级别的现有员工队伍进行彻底搜寻,以发现最
适合新职位的人才。平均而言,内聘的员工在业绩评估中获得的评价
要比外聘员工高,花费的成本则更低。不过,60%的招聘经理提出,
内部招聘可以通过更好识别现有员工的技能而得到改进。值得庆幸的
是,两种数字化趋势在过去的一年里交融在一起,使得识别内部人才
的任务变得容易得多。
首先,由于微软团队(Microsoft Teams)和Slack等协作平台的大量
采用,远程工作增加了员工产生的数字通信和工作产品的绝对数量。
第二,由于企业通常因诉讼、合规、保存记录和隐私的原因必须管理
这些“非结构化数据”,因此一些企业已采取了下一步的措施,利用这些数据来收集见解,或者说“人员分析”。员工数据代表着企业王
国中人力方面的关键因素,根据这些数据,几乎每一方面的表现都可
以利用现有的技术进行分析。从典型的“基于直觉的方法”提升为使用有意义但易受忽略的指标而做出的基于证据的决策。本着照亮未来道路的精神,我已将我们的一
些关键见解汇编成了这种新的范式。
着眼其他地方之前,先在内部物色
虽然“打造”而不“购买”并非人才获取方面的一个新概念,但
固有的困难在于对各个级别的现有员工队伍进行彻底搜寻,以发现最
适合新职位的人才。平均而言,内聘的员工在业绩评估中获得的评价
要比外聘员工高,花费的成本则更低。不过,60%的招聘经理提出,
内部招聘可以通过更好识别现有员工的技能而得到改进。值得庆幸的
是,两种数字化趋势在过去的一年里交融在一起,使得识别内部人才
的任务变得容易得多。
首先,由于微软团队(Microsoft Teams)和Slack等协作平台的大量
采用,远程工作增加了员工产生的数字通信和工作产品的绝对数量。
第二,由于企业通常因诉讼、合规、保存记录和隐私的原因必须管理
这些“非结构化数据”,因此一些企业已采取了下一步的措施,利用这些数据来收集见解,或者说“人员分析”。员工数据代表着企业王
国中人力方面的关键因素,根据这些数据,几乎每一方面的表现都可
以利用现有的技术进行分析。
管理类 / 日期:2024-03-11
理解那个东西,但是我已经发现,他的信息距离和我越来越近了。因为他不再看《舟山晚报》,我也不再看《新民晚报》了,我们看的都是腾讯新闻App,看新闻头条,他也看我的朋友圈。所以信息高速一旦被打通了,一、二线和三、四线城市之间的认知壁垒也逐渐被打破了。要掌握70%~80%的都市消费,其实就是掌握两亿中产阶层。像分众这样的公司,之所以能够覆盖78%有家庭汽车的、80
管理类 / 日期:2024-03-11
实现资产最大限度的增值。一些合伙人可以通过“股权转让”等资产重组方式退出。二、退出如何结算当合伙人退出公司后,其所持的股权应该按照一定的形式退出。一方面对于继续在公司里做事的其他合伙人更公平;另一方面也便于公司的持续稳定发展。而合伙人退出之后,如何结算也是一个问题。一般采用三种方法:估值法、参考相关法律、另外约定。估值法,即当合伙人中途退出,退出时公司可以按
管理类 / 日期:2024-03-05
公司工作和学习的指引,它能帮助您不断检讨和自我提高,它也是您的上级对您的工作进行评估的重要依据。请您务必与您的上级共同讨论,完成本计划书。公司工作和学习的指引,它能帮助您不断检讨和自我提高,它也是您的上级对您的工作进行评估的重要依据。请您务必与您的上级共同讨论,完成本计划书。二、外因评价请根据自己的认知从“A、B、C、D”中选择一个最适合自己的描述:三、我的
管理类 / 日期:2024-03-05
● ● 在一个软件团队中,编程人员说:“这些功能真的会增加测试过程的复杂性。”团队负责人该如何呼叫暂停?● ● 在一个致力于推出新技术电动车的制造团队中,一名初级工程师在主管能听到的距离内若有所思地说:“我不了解这些新电池。这些性能数据看起来不如我们预期的那样好。”主管该如何呼叫暂停?● ● 在一个消防队中,在进入一座失火的建筑物时,搬运软管的人员大喊:“这