楼主: mingdashike22
1783 46

[经济学] 利用机器学习建立福利预警系统 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-4-24 15:19:18
首先,它强调这些个体不是一个同质群体:ML算法可能会将一些个体归类为风险个体,因为他们有残疾,或者因为他们有照顾责任,而其他人可能会因为他们的迁移状态或年龄而被预测为风险个体。后者可能需要与前者不同的干预方案。因此,ML可用于识别风险个体,并在设计适合每个亚群体的治疗方案时补充单独或后续的因果分析。其次,它可以通过基于背景特征之间的复杂交互来识别群体,从而进一步补充因果分析。这可以改进现有的分析,这些分析侧重于一个维度以形成亚组(例如,年龄、性别或种族),从而为在因果分析中检查更复杂和多维度的异质治疗效果提供基础,例如通过随机对照试验(RCT)。与此相关的是,虽然我们的论文侧重于预测,但它可以被视为识别和描述风险个体的第一步:在后续步骤中,个案工作者可以专注于一个特定的亚组,并利用他们的专业知识(可能与背景bandit算法或之前RCT的发现相结合),将这些人分配到具有经证实的高治疗因果效应的特定项目中。因此,我们认为,本文提供了一个例子,说明了如何使用ML来获得准确的预测,并补充——而不是替代——旨在估计因果效应的标准计量经济技术。2.制度背景澳大利亚社会保障体系的主要目的是为人们提供“最低适足生活水平”(澳大利亚财政部,2010年)。

12
大多数88 在职认证  发表于 2022-4-24 15:19:24
提供的主要福利类别称为“收入补助金”,针对的是没有收入和/或资产或收入水平较低的个人。一般来说,对于这些接受者来说,收入支持金是他们的主要收入来源。这些福利金定期发放,并协助支付基本生活费用。2018年的最高年收入支持金额从12400澳元(失业福利)到20700澳元(残疾福利)不等,而年个人收入中位数为48400澳元(澳大利亚统计局2019b)。因此,那些领取收入补助金的人是一个非常弱势的群体。收入补助金主要有六类:(1)学生补助金;(2) 失业救济金;(3) 抚养费;(4) 伤残津贴;(5) 照顾者报酬;(6)养老金。这些主要的收入补助金都经过严格的经济状况调查。这意味着使用正式流程来确定个人的付款资格。权利基于当前(而非以前)的收入和资产水平。当收入和资产增加时,现金转移金额减少。这种有针对性的模式适用于所有的收入支持付款;然而,收入门槛和递减率(即收入增加时福利转移减少多少,资产增加多少)取决于收入支持支付的类型。例如,失业救济金的削减率最高,为50-60%,这意味着一旦领取者的收入达到约24400澳元,福利就会被削减。其他福利的削减率较低,为40-50%。在澳大利亚,失业救济金是向目前失业的任何个人提供的统一费率,前提是他们满足活动测试要求。

13
kedemingshi 在职认证  发表于 2022-4-24 15:19:30
需要注意的是,失业救济金不同于失业保险,因为前者的资格并不取决于以前的收入。这种严格的收入和资产测试使澳大利亚福利体系成为经合组织中最有针对性的体系之一。例如,2005年,在经合组织中,最贫穷的五分之一人口获得的转移支付的平均份额与最富有的五分之一人口获得的转移支付的比例为2.1,但在澳大利亚则高达12.4。换句话说,“最贫穷的20%的(澳大利亚)人口[获得]的社会保障福利是最富有的五分之一人口的12倍多”(怀特福德,2010年)。在很大程度上,福利制度旨在支持急需帮助的人。它通过提供目标明确的收入支持付款来实现这一点。近四分之一的澳大利亚人收到了这些付款。然而,澳大利亚ZF也通过社会保障体系提供财政支持,该体系不被视为收入支持支付。通过社会保障系统可获得的其他付款包括:旨在帮助家庭承担抚养子女费用的付款,如家庭税收福利、产假福利、主要收入支持福利的补充付款;还有租金援助。由于一些非收入补助金相对没有针对性,社会保障体系包括不一定在经济上处于不利地位的各阶层人口。作为社会保障体系中领取者构成的一个例子,在2018年的任何一个两周内,大约500万澳大利亚人获得了收入支持金,而大约85.5万个家庭获得了家庭税收福利(Whiteford 2018)。

14
nandehutu2022 在职认证  发表于 2022-4-24 15:19:36
2017-2018财年(AIHW 2019b),社会保障支出总计为1124亿澳元。虽然澳大利亚的社会保障体系规定了最低生活标准,并向那些没有能力养活自己的人发放补助金,但这一目标是,新移民在抵达澳大利亚后四年内没有资格领取失业救济金。9通过包括活动测试、监控和制裁来鼓励自力更生和互惠(Klapdor 2013)。例如,为了保持领取失业救济金的资格,领取者必须积极寻找、计划和准备未来的工作。未能遵守这些共同义务要求可能会导致付款损失。目前,根据“澳大利亚就业服务”计划,政府将所有失业人员就业援助计划外包给营利和非营利机构。提供者的报酬是根据服务投入、工作经验投资和培训的组合来支付的,重要的是,资金与就业结果有关。对澳大利亚就业服务项目进行评估的研究人员发现了案例工作者“撇奶油”的证据,比如将就业激活项目的目标对准那些结果更容易实现的人——因为对提供者的支付与结果有关(O’Sullivan et al.2019)。ML模型通过为每个人提供风险分数,可以为政府提供关于哪些家庭最有可能长期失业的详细指导。然后,这些信息可以通知外包就业服务的支付结构。在这种情况下,ML可以作为政府就业服务提供者关系的关键治理和审计工具。

15
nandehutu2022 在职认证  发表于 2022-4-24 15:19:42
ZF也有额外的教育和培训项目,以及专门旨在减少长期收入的指导服务。例如,2016年在澳大利亚,作为一项名为“尝试、测试和学习”的9200万美元计划的一部分,ZF将早期干预计划针对三个高危人群:24岁或以下的年轻看护者、18岁或以下的年轻父母,以及接受与学习有关的收入支持付款的学生。这些群体的选择基于对其估计终身福利成本的精算估值(社会服务部,2015年,普华永道,2016年;2019年)。其他考虑因素包括为这些群体提供的支持服务是否充分,以及他们对新的政策干预模式的预期反应。该倡议资助了一对一的定制支持,包括短期教育、研讨会、指导、工作安置和自营职业/创业倡议。在这种情况下,ML模型有助于进一步完善高风险个体的识别过程,尤其是在三个已识别的广泛群体中可能具有不同风险特征的个体。10  3. 数据3.1 2000年至2019年澳大利亚联邦社会保障记录构成我们数据集的基础。所有社会保障金都由名为Centrelink的国家福利机构管理。这些数据中有3200多万人在2000年至2019年间与Centrelink系统有过任何接触。所有登记者均为15岁或以上,因为这是最低资格年龄。

16
mingdashike22 在职认证  发表于 2022-4-24 15:19:50
这些登记者的财务状况差别很大:有些人有很高的财务需求,例如那些正在接受目标明确的收入支持付款的人;其他人的收入更高,并在社会保障系统登记,因为他们收到了上一节所述的非收入补助金之一,如一次性ZF奖金或子女费用。随着时间的推移,每一个人都会被频繁地跟踪。对于福利收据状态的主要变量,我们知道与付款收据相关的确切开始和结束日期。对于我们的研究来说,这种数据结构的一个关键优势是,我们可以构建一幅关于长期福利收入持续时间和动态的精确图像。我们观察如此频繁(每天)的数据是因为收入支持(或福利)支付具有高度的针对性。这意味着定期评估收款人的付款资格,并要求收款人在变更后14天内报告变更情况(如关系状态、收入或生活条件)。付款收据的开始和结束日期记录在我们的数据中。具体而言,接收人需要定期(每两周)向Centrelink报告其财务状况和生活安排,填写一份14-34页的表格,获取有关接收人(以及如果适用,合作伙伴)基本信息(姓名、地址、联系方式、性别、出生日期、民族、语言、公民身份、抵达信息)的信息,婚姻状况和关系事件史、受抚养子女的人口统计信息、住宿细节、就业和学习细节。

17
可人4 在职认证  发表于 2022-4-24 15:19:56
3.2样本我们的第一步是确定2014年从Centrelink收到任何类型付款的个人,以及2014年1月1日年龄在15至66岁之间的个人。平均而言,在2000-2018年期间,11个样本中的每个人的福利支出约为160950澳元。我们选择关注工作年龄人口,因为这是旨在防止长期福利依赖的项目的目标群体。我们的下一步是,出于存储数据的服务器的计算能力,从这个群体中随机抽取1%的样本(50615人)。此外,我们选择在2014年(基准年)重点关注社会保障体系中的个人。由此产生的样本不能代表整个澳大利亚人口(表1)。它不成比例地抓住了中低收入人群。澳大利亚福利计划的高度针对性意味着低收入个人的代表性过高。此外,向儿童的初级看护人提供非收入补助金,如儿童费用补助金。这意味着我们的样本中女性的比例更高,因为她们在儿童初级看护者中的比例仍然过高(以及在有资格获得其他看护者相关报酬的个人中)。然而,值得强调的是,鉴于该样本关注的是弱势群体,它适合我们预测福利依赖性的目标。然后,我们计算2015年至2018年(包括2015年至2018年)个人的福利收入强度。请注意,我们忽略了2000年至2013年的数据。这使我们能够在全球金融危机影响消失后的一段时间内估计机器学习算法。我们还选择将2019年排除在外,因为我们的观察窗口将于2019年10月14日结束。

18
大多数88 在职认证  发表于 2022-4-24 15:20:03
如果存在与福利收入相关的强烈季节性模式,部分纳入2019年数据点可能会使我们的结果产生偏差。3.3因变量(结果)我们将福利收入的强度计算为个人在2015年至2018年四年期间收到收入支持付款的时间比例:即。,从2015年1月1日到2018年12月31日,他们收到收入补助金的天数表明,2014年15岁以上的澳大利亚人口约为1900万(澳大利亚统计局,2014年)。2014年(我们的基准年),大约700万人在Centrelink系统中注册。在2014年的Centrelink注册人中,大约有500万人年龄在15-66岁之间。1%的样本为我们提供了50615人的最终样本。12按这段时间内的总天数计算。我们选择这四年来计算领取福利的期限,因为它足够长,可以确定长期的福利依赖,但也足够短,这样我们就不会模糊个人在生命周期不同阶段的需求。我们对福利收入强度的衡量与之前的研究和政府审查(如最近的McClure review,2015年福利改革参考小组)对福利依赖的概念一致。它也捕获了比只考虑收入支持在一个时间点的措施更严重的经济劣势。这一点很重要,因为领取福利金与依赖福利并不相同——这一点在文献中得到了充分强调(Penman 2006)。在澳大利亚,长期福利收据是一个普遍存在的问题。

19
kedemingshi 在职认证  发表于 2022-4-24 15:20:09
例如,2018年,年龄在18-64岁之间的收入支持受助人中,近四分之三的人已经领取了两年或两年以上的款项,而在2009年领取收入支持金的人中,超过一半(56%)在2018年9年后领取了款项(AIHW 2019a)。这个问题也越来越重要。2018年,24.5%的15岁及15岁以上的失业者已经找了一年以上的工作(年均),高于2009年的14.8%(澳大利亚统计局2019a)。图1描绘了收入支持强度的分布。在图1的面板A中,以我们样本中的每个人为重点,我们看到从未获得过收入支持的人的比例(样本的32.3%)以及在2015年至2018年期间一直获得收入支持的人的比例(样本的36.7%)出现峰值。在图1的面板B中,我们显示了排除两种极端情况后的收入支持强度分布。在这里,我们看到了更均匀的分布在整个光谱的强度与一些浓度在较高的一端。作为扩展,我们还预测了“长期失业救济金领取”的结果。这代表了长期失业,鉴于最近新冠肺炎引发的经济衰退以及随之而来的高失业率,这一点尤为重要。关注失业救济金也很有用,因为长期领取失业救济金表明未能实现其主要目的:在人们从失业过渡到就业的过程中充当临时性的救济金。

20
nandehutu2022 在职认证  发表于 2022-4-24 15:20:16
此外,如前所述,我们的ML模型可能会实现一个有用的目标。这种bi模型模式在2000年至2019年的整个时期都很常见。13治理和审计的作用是确保在第三方就业服务提供商做出资源分配决策时,最有可能长期失业的个人不会被过度忽视。图2描绘了失业救济强度的分布。与“任何”类型的收入支持收据的模式类似,我们看到从未领取过失业救济金的人的比例(样本的50.5%)以及2015年至2018年期间一直领取失业救济金的人的比例(样本的30.3%)出现了激增。图2的面板A对此进行了说明。一旦我们排除了这两种极端情况(图2的B组),我们就可以看到在较低的一端有较高的强度集中。3.4独立(输入)变量DOMINO数据捕获关于个人的广泛信息。根据2014年(基准年)观察到的数据,我们包括以下信息:人口统计(性别、年龄、出生国和土著地位);家庭结构(父母身份、子女数量和子女年龄)、政府福利接收历史(按福利类型);个人关系(伙伴关系状态和婚姻状况,以及关系状态的持续时间和不稳定性);就业和就业不足(零小时合同);工作不稳定;位置和居住流动性;住房教育收入和财富。高频DOMINO数据的一个关键好处是能够对经济行为的动态进行建模。例如,我们包含了一些变量,这些变量反映了收入支持历史和就业期间的不稳定性、可变性和强度(数量或持续时间)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 02:05