楼主: mingdashike22
1783 46

[经济学] 利用机器学习建立福利预警系统 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-4-24 15:18:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Using Machine Learning to Create an Early Warning System for Welfare
  Recipients》
---
作者:
Dario Sansone and Anna Zhu
---
最新提交年份:
2021
---
分类信息:

一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
英文摘要:
  Using high-quality nation-wide social security data combined with machine learning tools, we develop predictive models of income support receipt intensities for any payment enrolee in the Australian social security system between 2014 and 2018. We show that off-the-shelf machine learning algorithms can significantly improve predictive accuracy compared to simpler heuristic models or early warning systems currently in use. Specifically, the former predicts the proportion of time individuals are on income support in the subsequent four years with greater accuracy, by a magnitude of at least 22% (14 percentage points increase in the R2), compared to the latter. This gain can be achieved at no extra cost to practitioners since the algorithms use administrative data currently available to caseworkers. Consequently, our machine learning algorithms can improve the detection of long-term income support recipients, which can potentially provide governments with large savings in accrued welfare costs.
---
PDF下载:
--> Using_Machine_Learning_to_Create_an_Early_Warning_System_for_Welfare_Recipients.pdf (918.75 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 预警系统 Quantitative Contribution Practitioner

沙发
大多数88 在职认证  发表于 2022-4-24 15:18:23
1.使用机器学习为福利领取者创建早期预警系统 Dario SansoneAnna ZhuThis版本:2021年5月摘要使用高品质的全国性社会保障数据结合机器学习工具,我们开发的预测模型的收入支持收据强度在澳大利亚社会保障系统在2014和2018之间的任何支付恩怨。我们证明,与目前使用的更简单的启发式模型或早期预警系统相比,现成的机器学习算法可以显著提高预测精度。具体而言,前者预测个人在随后四年中获得收入支持的时间比例更准确,与后者相比至少增加了22%(R2增加了14个百分点)。由于算法使用的是当前可供个案工作者使用的管理数据,因此这一收益可以在不增加从业人员成本的情况下实现。因此,我们的机器学习算法可以改进对长期收入支持接受者的检测,这有可能为ZF节省大量应计福利成本。关键词:收入支持;机器学习;澳大利亚果冻:C53;H53;I38;J68  我们感谢Bruce Bradbury,Simon Feeny,David McKenzie,Tim Reddel和Tim Robinson,以及在社会政策研究中心、新南威尔士大学和澳大利亚国立大学发表的研讨会的参加者,他们有帮助的意见。霍英景提供了出色的研究协助。朱先生感谢澳大利亚研究委员会(ARC)链接项目(LP170100472)的支持。本文使用社会服务部(DSS)Centrelink行政记录中的单位记录数据。

藤椅
mingdashike22 在职认证  发表于 2022-4-24 15:18:29
本文报告的结果和观点是作者的,不应归于ARC或DSS。所有的错误都是我们自己的。埃克塞特大学和IZA。电子邮件:d。sansone@exeter.ac.ukRMIT大学和伊扎。电子邮件:安娜。zhu@rmit.edu.au21.导言长期收入支持(福利)收据是世界各地许多ZF旨在防止的问题(Hanna 2019、HM Government 2010、Reddel 2018、Scoppetta and Buckenleib 2018、福利工作组2011)。在基本保障和/或有针对性的福利制度中,收入支持金旨在为无法通过私人收入满足基本消费需求的家庭提供最低生活水平(Korpi和Palme,1998年)。因此,长期定期获得收入支持的个人最有可能遭受长期的经济劣势和社会排斥。对收入支持的根深蒂固的依赖也给ZF预算带来了巨大的需求,降低了整个经济的市场产出,并导致福利文化的代际传播(Cobb-Clark等人,2017年,Dahl等人,2014年,Dahl和Gielen 2020年)。由于新冠肺炎引发的经济衰退,个人长期失业,与根深蒂固的收入支持依赖相关的问题可能会加剧。为了防止这种根深蒂固的依赖,政策制定者试图通过劳动力市场激活计划和个案管理,对高风险登记者的福利事业进行早期干预。然而,早期干预计划的第一步是确定目标群体。

板凳
能者818 在职认证  发表于 2022-4-24 15:18:35
例如,在澳大利亚,ZF特别关注处境最不利的个人,因此最有可能长期享受福利(就业部,技能2020,社会服务部2018)。为了反映这一目标,我们利用高质量的全国性社会保障数据,结合机器学习(ML)工具,为澳大利亚社会保障体系中的任何支付注册者开发了收入支持收据强度的预测模型。澳大利亚案例研究的一个关键吸引力在于它拥有世界上最具针对性的福利体系之一,这意味着当我们预测长期收入支持的风险时,我们可以密切预测持续贫困和社会排斥的发生率(Whiteford,2010年)。此外,我们的研究与政策极为相关,也非常及时,因为澳大利亚ZF目前正在针对早期干预项目试用创新的分析工具,具体目标是防止福利依赖(Reddel,2018)。如果这一预警系统被证明是成功的,那么它可以成为其他国家在资源分配解决方案方面的蓝图。3目前,识别这些高危人群涉及简单的分析工具、终身福利成本评估和/或个案工作者评估。然而,由于多种原因,这些筛查设备可能会导致资源定位不良。首先,简单的筛查工具无法很好地预测或识别谁有长期福利领取的风险,因为这种结果可能是多种风险因素的产物和相互作用,而这往往无法用一套很小的预警指标来预测(Bradbury和Zhu 2018)。

报纸
nandehutu2022 在职认证  发表于 2022-4-24 15:18:41
第二,一线员工可能会做出“撇奶油”的针对性决策,比如将就业激活计划的提供倾斜给那些更容易实现结果的人。对于将高比例(澳大利亚为100%)的就业服务外包给私人机构,以及薪酬与结果挂钩的国家来说,这种情况尤其普遍(O’Sullivan等人,2019年)。第三,目前识别高风险注册人的做法也让个案工作者负担过重:例如,在澳大利亚,一名个案工作者在任何时候都有超过100名客户的平均案件量(戴维森2019)。此外,这种劳动密集型筛查过程可能会导致资源从个性化干预工作中转移。以更高的准确性和更低的成本识别高风险个体是本文的主要动机。我们使用的数据质量很高,因为ZF依靠这些准确的数据来确定个人是否有资格获得收入支持。由于个人的支付金额是其收入、财富、储蓄、家庭结构和其他几个社会经济因素的直接函数,因此这些数据中的信息与澳大利亚税务局的记录相一致,以确保准确性。这些数据也很频繁,每天都有关于收入支持收据状态的信息,跟踪2000年至2019年的客户。由于这些数据包含丰富的协变量(约1800个可能的预测因子),规模大(超过3200万个个人客户),且案例工作者易于获取,因此它们是校准ML算法和为长期福利受助人设计早期预警系统的理想之选。

地板
nandehutu2022 在职认证  发表于 2022-4-24 15:18:47
我们确定哪些人最有可能遭受长期不利影响,并因此获得收入支持。因此,我们的结果与针对两种类型的政策响应相关——一种是解决需求的,另一种是寻求减少ZF转移支付。值得注意的是,领取福利本身并不一定是一个问题,因为它可以保护领取者的健康和福祉,尤其是那些面临意外冲击或重大结构性工作障碍的人(Aizer和Currie,2004年;Mirut和Tudor,2018年)。相比之下,根深蒂固的对收入支持的依赖被认为是计划设计中的意外工作成本抑制因素,例如目标明确的福利系统(Feldstein 2005、Hoynes 1997、Hoynes and Schanzenbach 2012、Moffitt 1985、1992)。4我们的重点是任何收入支持的结果,因为这也是澳大利亚ZF的重点。鉴于过去的经济文献(Card et al.2007、2015、Schmieder和von Wachter 2016)强调了这一点,我们还将其作为长期领取失业救济金结果的扩展ML算法进行了估算。失业救济金领取者是所有收入支持领取者的子集。求职者福利资格的一个显著特点是,与领取残疾福利或育儿津贴等其他类型收入补助金的人相比,他们需要满足额外的求职和活动要求。我们的研究主题涉及之前的两项工作。第一个是关于估算ML模型以告知资源分配决策的新兴文献。

7
大多数88 在职认证  发表于 2022-4-24 15:18:54
该文献表明,与标准回归工具相比,ML算法可以更好地预测有风险的个体,因此可以帮助员工进行日常决策(Kleinberg et al.2015)。例如,法官可以改进保释决定(Kleinberg等人,2017年),卫生检查员可以更有效地分配到不卫生的餐厅(Glaeser等人,2018年,Kang等人,2013年),项目管理人员可以更好地针对高危青年进行干预(Chandler等人,2011年),雇主可以做出更好的雇佣决定(Hoffman等人,2018年),学校可以及时识别有辍学风险的学生(Sansone 2019),ZF官员可以防止虐待和虐待儿童(Cuccaro Alamin等人2017年,Vaithianathan等人2013年),外科医生可以更道德、更有效地筛查髋关节置换手术患者(Mullainathan和Spiess 2017年)。此外,研究人员将ML与卫星数据相结合,预测调查和行政数据有限的国家的贫困水平(Jean等人,2016年,Yeh等人,2020年)。尽管ML的潜力和应用存在局限性(克孜勒塞克等人,2020年,麦肯齐和桑森2019年,萨尔加尼克等人,2020年),但研究人员已经开始分析这些算法在用于补充人类专家的判断和技能时如何(以及是否)增加价值(史蒂文森和多莱克2019年)。例如,一旦ML模型识别出高风险个人,个案工作者就可以选择哪些类型(或强度)的项目应该针对哪些个人——这是解决背景强盗问题的一种方式(Athey 2019)。

8
能者818 在职认证  发表于 2022-4-24 15:19:00
据我们所知,ML模型尚未应用于预测长期收入支持收入的风险。5第二篇文献研究了解释长期收入支持收入的因素。在分析这一主题时,会出现一些相关问题,这些问题往往源于数据限制。第一福利流失(即重复退出和重新进入福利系统)和福利伤痕(即,由于过去的收入支持收入,目前收入支持收入增加的可能性)是常见现象:时间点衡量或每年的福利收入快照可能无法捕捉到这些动态(B"ackman and Bergmark 2011、Barrett 2000、Bhuller等人2017、Tseng and Wilkins 2003)。其次,符合条件的个人不接受收入补助金是一个重要问题,使用排除非受助者的数据无法说明他们的收入和就业结果(Bitler等人,2003年,Currie和Grogger,2001年)。最后,在解释根深蒂固的福利收入时,个人特征(如年龄、性别、种族、家庭结构)的影响与结构性因素(如地理、政策改革、宏观经济条件)的影响相互作用(Bradbury和Zhu,2018)。因此,准确灵活地建模个人特征和长期收入支持收入之间的关系需要更大的数据和更丰富的协变量集。本研究通过开发长期收入支持收入的预测ML模型,将这两个研究领域的创新联系起来。我们使用社会保障系统登记的全部人口的新数据。该数据集称为“多个单独事件的数据”(DOMINO)。这些数据有几个关键的好处。

9
nandehutu2022 在职认证  发表于 2022-4-24 15:19:06
首先,从2000年到2019年,他们的频率很高,每天都有收入支持收据状态的信息。这些重复观察可以分析福利退出和进入的动态。第二,他们既包括福利领取者,也包括接受其他ZF转移支付的个人,因此他们也包括没有收到收入支持付款的个人。第三,它们包含了2000年至2019年间任何时候与社会保障系统有联系的3200多万人的丰富信息,因此代表了一个用于校准ML算法的大型数据集。第四,与以往依赖调查数据和/或从业人员无法直接获得或与其日常任务相关的数据的ML申请不同,个案工作者和一线机构工作人员已经可以访问这些行政数据。这使我们能够用代表感兴趣群体的数据来验证我们的算法,并使我们更容易在未来的决策过程中集成这里开发的ML算法。还有证据表明,行政数据往往优于行为数据,并减少隐私侵犯问题(Bjerre Nielsen et al.2021)。6我们认为,应用于这些新颖丰富数据的估计ML模型,可以在很大程度上解决福利机构面临的资源分配问题。其他研究人员也强调了将ML与大量管理数据结合使用以识别高危个体的好处(Van Landeghem et al.2021)。事实上,我们首先表明,与目前使用的简单预测模型或早期预警系统相比,我们估计的ML模型显著提高了预测精度。

10
能者818 在职认证  发表于 2022-4-24 15:19:12
具体来说,我们的模拟表明,与其他模型相比,ML算法可以将预测个人获得收入支持的时间比例的模型的R2增加至少22%(或14个百分点)。因此,我们的机器学习算法可以改进对长期收入支持接受者的检测,这些接受者的福利成本比当前系统中确定的个人高出近10亿澳元。其次,我们认为,预测模型可以通过系统化识别过程来改善决策,有助于仅使用短期变量及时识别有风险的个人,甚至可能在他们注册到系统后立即识别。当事先不了解注册人的情况时,这尤其有用。通过这种方式,我们的预测模型可以减少个案工作者的工作量压力(因为它们充当自动筛查设备),并且通过避免任意选择预测因子或亚组,有可能检测并因此防止有意识和/或无意识的偏见(Kleinberg et al.2020,Kretsedemas 2005,McBeath et al.2014,Pentaraki 2019),以及“撇奶油”。类似地,与仅依赖于个案工作者专业知识和培训的启发式评估和预测相比,这些ML预测可以提供给个案工作者,而不需要他们接受任何额外的ML培训。此外,这些改进可以以低成本进行。事实上,当我们的预测模型与个案工作者的专业知识相结合时,它们可以实现更好的分配政策。在识别出有风险的个体后,本文阐述了无监督最大似然法的应用,根据这些个体的可观察特征将其分为不同的群体。将高危人群聚集在一起有两个好处。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 04:50