楼主: mingdashike22
1996 41

[经济学] 天气因素对机器学习迁移意向的影响 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-4-26 11:30:20
SPEI的另一个优点是温度(图11)。此外,由于其固定的平均值和标准差,它在时间和空间上具有可比性。4.2.2 SPEI和Lagstimescales反映了干旱对水源可用性的影响。气候学界已确定2015年5月的3个月时间尺度是2015年3月、4月和5月气候水平衡总和的函数。通过构造,SPEI具有零均值和统一标准差。预印本——2020年12月8日,强度、持续时间和空间覆盖率有所不同(Eslamian[18])。气象干旱捕捉到的延伸性受水文干旱捕捉到的长期降水异常的影响。农业干旱发生在作物生产受到降水异常影响的时候。在某种程度上,气象干旱是最温和的情景,而水文干旱是干旱发生的最严重情景,农业干旱介于两者之间。从这个意义上说,1个月或2个月的SPEI测量可以显示气象干旱的存在和程度;农业干旱的SPEI为1个月至6个月,水文干旱的SPEI为6个月至24个月(Wilhite和Svoboda[36])。我们面临的主要挑战是了解哪种气候条件对移民至关重要,以及从采访月份开始的过去四年中,哪种时间跨度估计了SPEI,这导致总共49个滞后(lag0–lag48)。为了了解SPEI干旱指数如何影响迁移意愿(正或负),SPEI的连续值离散为七个相等的箱。对于特征Xi,装箱步骤是因此装箱步骤(Xi)=max(Xi)- min(Xi)(3)其中是SPEI时间刻度。这种离散化允许限制我们的模型对PEI值的高可变性的敏感性。

22
kedemingshi 在职认证  发表于 2022-4-26 11:30:26
附录中的图A.3提供了一个离散化示例。5结果在本节中,我们通过将机器学习算法应用于结合迁移意图数据(GWP)和天气冲击数据(SPEI)构建的数据集(见第4节)来报告结果。5.1协议我们在运行MacOS的Intel Core i5 64位处理器(2.7GHz)和16GB内存的计算环境中运行了所有实验。我们对整个数据集(ALL)进行了测试,然后对表1中描述的功能组进行了测试。为了降低过度装配的风险,我们使用10倍交叉验证工作流程。对于每个数据集和每个依赖变量(一般或国际迁移意图),我们分别使用基于树的ML算法的R实现进行了实验:DT:决策树(Quinlan[29])、RF:随机森林(Breiman[10])和XGB:极端梯度增强(Chen和Guestrin[14])。表2显示了用于这些算法的最佳参数(第3.3节)。我们的发现按照第2.3节提出的问题的顺序进行。DT RF xGB成本复杂度=10-5mtry=5 mtry=3树深=30棵树数=1080棵树数=761节点数=20表2:每种算法的最佳参数。mtry:每个节点上可能的拆分数。问题1。基于树的ML算法的性能比较我们根据AUC(参考文献均来自XGB算法)将基于树的方法在测试集上的结果与图6中的DT、RF和XGB进行比较。

23
能者818 在职认证  发表于 2022-4-26 11:30:33
天气对移动意图的影响2015年5月接受采访的个人在12个月的时间尺度上获得滞后6的SPEI,SPEI值是6个月前2014年11月的SPEI12值。预印本——2020年12月8日●●●●●●国际移动一般移动RF XGB DT RF XGB0。60.70.80.91.0绩效指标:●精度AUC精度重新校准图6:所有六个国家在整个数据集(即GWP和天气数据)中基于树的测试集算法的性能。公制移动平均值。都很卑鄙。GWP t.value p.value Comparison国际0.770.76(0.7567)4.000.00All>GWP通用0.760.75(0.7462)4.760.00All>GWPAUCinInternational 0.730.715.510.00All>GWP通用0.690.667.700.00All>GWPACcuracycyinternational 0.750.74(0.7416)1.950.08All~GWP通用0.750.748(0.7384)1.930.08 ALL~GWP通用0.950.940.0900(0.9793)-14.25 0.00 ALL<GWP表3:使用XGB算法对测试集进行GWP与ALL(GWP+天气)的t检验。ALL=GWP+天气),使用XGB算法。对测试集上的精度和AUC测量值进行的t检验比较表明,整个数据集上的分类(即,所有数据都包含天气信息)显著优于SDATA,从而提高了精度和AUC的预测能力。精度方面的t检验比较表明,单个调查(即GWP)和整个数据集(即ALL=GWP+天气)之间的模型没有差异。回想一下,GWP的模型优于ALL的模型,后者是几个气候条件不同的国家。我们将在下一节对此进行调查。问题3。

24
可人4 在职认证  发表于 2022-4-26 11:30:39
一般模型或特定国家模型为了决定我们是否能为所有六个国家建立一个一般预测模型,我们进一步调查了六个国家(一般模型)和每个国家(特定国家模型)对国际和一般移民意向的预测表现。用于GWP+天气数据集(全部)。每个指标(准确度、AUC、准确度和召回率)的水平虚线表示使用所有国家数据集训练的通用模型的平均性能。每个垂直线都带有预印本——2020年12月8日●●●●●●●●●●●●国际行动总行动布基纳法索FasoIvory海岸MalimaritanigerSenegalburkina FasoIvory海岸MalimaritanigerSenegal0。60.70.80.91.0绩效A国家平均值:●准确度AUC精度再校准所有国家的平均值:准确度AUC精度再校准图7:六个国家模型(虚线)的平均性能与每个国家模型(形状)在测试集中的性能之间的比较。形状代表每个指标的特定国家绩效。例如,考虑到精度,马里和尼日尔的国家特定模型优于使用整个数据集进行国际迁移预测的一般模型,布基纳法索、马里和尼日尔的一般迁移预测也是如此。因此,用一个模型概括移动的意图可能会产生误导,因为有些国家不适用于一般模型。此外,一个国家的不同目标的绩效可能不同。例如,显示的精度性能较低,与国际移动意图一致。这指导我们,在分析气候与移民之间的关系时,研究每个国家的模式是至关重要的。第四季度。重要特征在六个国家中的五个国家,我们发现性别和年龄对国际和一般移动意图的影响更大。

25
可人4 在职认证  发表于 2022-4-26 11:30:45
在图8中,性别特征(“男性”)被视为三个国家的第一个重要特征,分别是国际和总体迁移意图。总体而言,男性搬家的意愿高于女性,而35岁至49岁的人可能会留在目前的住所。虽然我们无法推断确切的原因,但正如之前的研究(Djamba[16])所述,超过35人不太倾向于搬家。在国外建立单距离连接(“mabr”)对移民决策有积极影响。SPEI特征是象牙海岸最重要的特征,其次是年龄特征。然而,我们无法概括这些发现。1国际和一般搬家意向(图8)。下一节显示了天气特征的影响,结果与排列特征重要性相似。参考附录中的图B.1。预印本-2020年12月8日Maleage35plusage1524Mabr1 2 3 4 5 1 2 3 5 1 2 3 4 50.050.100.150.20重要功能国家:● 布基纳法索● 象牙● 马里● 毛里塔尼亚● 尼日尔● 塞内加尔目标:国际移动通用移动图8:对每个目标具有更高功能重要性的GWP功能。本月前几个月国际行动总的行动5 10 15 20 25 30 35 40 45 48尼日利亚难民象牙海岸马里布吉纳法索国家福利海岸马里毛里塔尼亚布吉纳法索拉格斯国家PEI1 3 6 12 18 24图9:重要的SPEI时间表和滞后期。国家的顺序是基于重要时期的出现。每个国家的平均重要性值是象牙海岸和毛里塔尼亚。这一发现与两种类型的移动相关,即国际移动和一般移动。在塞内加尔,天气特征对国际迁移意向的影响高于平均重要性。问题5。

26
可人4 在职认证  发表于 2022-4-26 11:30:51
SPEI和月度滞后对移动意图的影响图9显示了最显著的SPEI时间尺度和滞后期,至少连续三个月,基于滞后的显示。略带红色的时期代表由较短的时间尺度(即1、2、3、6、12)组成的SPEI,而蓝色的预印本则代表2020年12月8日。。151,0.338](0.070.080.090.10(-1.47,-1.07](-1.07,-0.66](-0.66,-0.255](-0.255,0.151](0.151,0.556)(0.556,0.961)(0.961,1.37)SPEI 12L35预测(-1.62,-1.1](-1.1,-0.584](-0.584,-0.0657](-0.0657,0.453](0.453,0.971)(0.971,1.49)(1.49,2.01)SPEI 12L47 SPEISPEI0.070.080.090.10预测0.190.200.210.22-0.(-1.62,-1.13](-1.13,-0((-0(-0.64.641](01 0((0.3380.828,0.82(1.32,1.321.81)预测PEI[国际][一般][一般].151]SPEI 12L40图10:BurkinaFaso中所选SPEI时间尺度和V形滞后组合的部分依赖图(PDP)。严重的干旱和洪水是国际和一般移民意图的指标。代表较长的项目(即18、24)。我们发现,在总体移动意图中,红色的情节更明显,而在国际移动意图中,蓝色的情节更明显。这意味着,国际迁移对SPEI的较长时间范围有更大的影响,因为它可能需要更长的时间来做出永久性决定,而包括内部迁移在内的一般迁移则更受SPEI较短时间范围的影响。特别是,布基纳法索和毛里塔尼亚的SPEI较短,影响总体迁移意向,而毛里塔尼亚的国际移民意向则受到较长SPEI的影响。除了塞内加尔和布基纳法索的某些时期外,我们发现24个月以上的滞后更可能影响移民意向。

27
kedemingshi 在职认证  发表于 2022-4-26 11:30:57
对这一结果的解释是,潜在的移民会因为发生气象/农业干旱而在国内流动,而国际移民则是对更严重的水文干旱的反应。这表明,气候条件的严重性决定了移民计划的激烈程度。由于恶劣天气条件在时间和空间上高度相关,因此需要保护来自更长距离类型的移民(例如国际移民)免受这些条件的影响。绘制全球模式很有挑战性,因为结果是特定于国家和移民类型的,因此,进一步研究重要特征、人口特征是国际和一般移民意向的基本驱动因素(再次考虑国家和移民类型之间的异质性)。SPEI干旱指数是每个国家的重要tolag组合。它包括每个SPEI指数和每个滞后分布的更多细节,以及SPEI时间尺度和滞后组合的总体结果。影响迁移的不同SPEI指标记录了事件,以及(ii)为什么这些滞后显得很重要。值得注意的是,由于不同的国际和一般移民意图,不同国家的结果有所不同。例如,与其他国家相比,我们的发现可以解释布基纳法索的重要SPEI影响呈V形(图10)。这表明,SPEI的高度负值(如严重干旱)和正值(如严重洪水)增加了国际和全球移动的可能性,而接近于零的值则降低了这种可能性。我们观察到这种V型影响主要发生在4月开始种植,12月收获期结束的月份。

28
nandehutu2022 在职认证  发表于 2022-4-26 11:31:03
过去三次天气事件的4月份降雨量不足或过剩对经济活动具有重要意义。更长的时间尺度(≥18个月)转介tohttps://climatedataguide.ucar.edu/climate-data/standardized-precipitation-evapotranspiration-index-spei.The国际搬家的问题(Q2)实际上是问人们是否想永久搬到另一个国家。我们在本文中考虑的国家的经济活动高度依赖于农业部门。知道灌溉基础设施缺乏,而且这些部门主要靠雨水灌溉,天气条件对农业生产和创收有重要贡献。预印本——20200年12月8日12 24 36 4835 47400 12 24 36 48 5月份种植生长收获期当前月份的回顾图11:布基纳法索高粱、玉米和小米的种植季节,包括主要在5月份进行的GWP访谈前四年的种植生长和收获期(图3)。第35、40和47个月显示了图10.6 DiscussionData quality review中显示的显著滞后。任何数据分析过程都取决于数据本身的质量。在这项研究中,我们结合了几个数据源来构建我们的数据集。从GWP数据来看,本研究中的不准确引入了偏差,我们使用了SPEI值,代表了几个指标的集合。然而,使用温度和降水量等原始指标也会带来好处。这些指标可以为这项研究带来更为分门别类的观点。最后,等仓离散化的优点是限制了我们的模型对不同SPEI值的敏感性。

29
nandehutu2022 在职认证  发表于 2022-4-26 11:31:09
然而,这样做的缺点是对不同范围的冲击给予相同的重视。方法审查。关于所使用的方法学,机器学习(ML)的使用为非应用科学带来了一个新的视角,它可以处理一些问题,例如大数据集、非线性和多重共线性。通过这些方法获得的预测结果与参数估计中允许的因果推断之间需要明确区分。为了避免ML方法提供因果推理的局限性,我们使用了特征重要性和部分依赖性度量来解释获得的结果。然而,在ML中还需要进一步的努力,以建立替代方法,整合几位应用科学作者[,,]倡导的因果推理。此外,我们还可以研究其他方法,如神经网络和无监督学习方法,以提高性能。结果回顾。结果表明,天气特征比仅使用GWP24(4个月)增加了更多的预测能力,驱动了更多的国际移动意图,而较短的时间尺度SPEI(例如1、12个月)影响了内部或总体移动意图。这是合理的,因为国际移民决策可能需要较长时间来收集和评估信息。正如社会科学文献所示,我们还发现,基于每个国家进行调查至关重要,因为有不同强度的独特特征影响着移民的意愿。此外,男性更倾向于移动,而35-49岁的年龄组则更倾向于停留[]。正如文献中所发现的那样,较年轻的群体(15-24岁)更倾向于移居国外[]。不幸的是,有几个连续超过五个月的周期,SPEI的功能重要性值高于平均值。

30
大多数88 在职认证  发表于 2022-4-26 11:31:15
发现的大多数时期是连续三个月,之后是连续四个月的两次,以及连续五个月的一次。总的来说,很难得出任何符合之前文献中非决定性结论的全局模式。7结论总之,天气特征影响迁移意图的预测性能。我们研究了三种基于树的机器学习算法,并使用GWP数据得出了性能更好的XGB算法的结果,其预测性能显著高于没有天气冲击数据集的情况。此外,SPEI的长时标(例如18、24个月)会促使更多的国际移民意向,而SPEI的短时标(例如1、12个月)会影响总体移民意向。然而,要概括全球气候模式对移民意向的影响并不容易。总的来说,在个体特征中,性别、年龄和网络是一个重要特征。例如,男性表现出更高的移民意愿,而15-24岁的群体则表现出更高的国际移民意愿。除了SPEI值之外,使用神经网络,并将因果推理与ML方法相结合。预印本——2020年12月8日确认该研究得到了ARC公约“理解和模拟全球移民趋势的新方法”(公约18/23-091)的支持。该项目获得了欧盟地平线2020研究与创新项目的资助,该项目由玛丽·斯科多夫斯卡·居里(Marie Sklodowska-Curie)第754412号赠款协议资助。我们感谢FrédéricDocquier教授对该项目的审查、建议和早期讨论。我们要感谢Shari De Baetsfo博士的反馈和评论。参考文献[1]S.Athey。用于政策评估的机器学习和因果推理。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 05:45