楼主: mingdashike22
1995 41

[经济学] 天气因素对机器学习迁移意向的影响 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-4-26 11:28:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Impact of weather factors on migration intention using machine learning
  algorithms》
---
作者:
John Aoga, Juhee Bae, Stefanija Veljanoska, Siegfried Nijssen, Pierre
  Schaus
---
最新提交年份:
2020
---
英文摘要:
  A growing attention in the empirical literature has been paid to the incidence of climate shocks and change in migration decisions. Previous literature leads to different results and uses a multitude of traditional empirical approaches.   This paper proposes a tree-based Machine Learning (ML) approach to analyze the role of the weather shocks towards an individual\'s intention to migrate in the six agriculture-dependent-economy countries such as Burkina Faso, Ivory Coast, Mali, Mauritania, Niger, and Senegal. We perform several tree-based algorithms (e.g., XGB, Random Forest) using the train-validation-test workflow to build robust and noise-resistant approaches. Then we determine the important features showing in which direction they are influencing the migration intention. This ML-based estimation accounts for features such as weather shocks captured by the Standardized Precipitation-Evapotranspiration Index (SPEI) for different timescales and various socioeconomic features/covariates.   We find that (i) weather features improve the prediction performance although socioeconomic characteristics have more influence on migration intentions, (ii) country-specific model is necessary, and (iii) international move is influenced more by the longer timescales of SPEIs while general move (which includes internal move) by that of shorter timescales.
---
中文摘要:
在实证文献中,气候冲击和移民决策变化的发生率越来越受到关注。以前的文献得出了不同的结果,并使用了大量传统的实证方法。本文提出了一种基于树的机器学习(ML)方法,以分析在布基纳法索、科特迪瓦、马里、毛里塔尼亚、尼日尔和塞内加尔等六个依赖农业的经济国家,天气冲击对个人移民意愿的影响。我们使用列车验证测试工作流程执行了几种基于树的算法(例如XGB、随机森林),以构建健壮且抗噪声的方法。然后,我们确定重要的特征,这些特征显示了它们影响迁移意图的方向。这种基于ML的估算考虑了不同时间尺度和各种社会经济特征/协变量的标准化降水蒸散指数(SPEI)捕捉到的天气冲击等特征。我们发现(i)天气特征提高了预测性能,尽管社会经济特征对移民意向有更大的影响,(ii)国家特定模型是必要的,(iii)国际迁移受SPEI较长时间尺度的影响更大,而一般迁移(包括内部迁移)受较短时间尺度的影响更大。
---
分类信息:

一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Computer Science        计算机科学
二级分类:Artificial Intelligence        人工智能
分类描述:Covers all areas of AI except Vision, Robotics, Machine Learning, Multiagent Systems, and Computation and Language (Natural Language Processing), which have separate subject areas. In particular, includes Expert Systems, Theorem Proving (although this may overlap with Logic in Computer Science), Knowledge Representation, Planning, and Uncertainty in AI. Roughly includes material in ACM Subject Classes I.2.0, I.2.1, I.2.3, I.2.4, I.2.8, and I.2.11.
涵盖了人工智能的所有领域,除了视觉、机器人、机器学习、多智能体系统以及计算和语言(自然语言处理),这些领域有独立的学科领域。特别地,包括专家系统,定理证明(尽管这可能与计算机科学中的逻辑重叠),知识表示,规划,和人工智能中的不确定性。大致包括ACM学科类I.2.0、I.2.1、I.2.3、I.2.4、I.2.8和I.2.11中的材料。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
--> Impact_of_weather_factors_on_migration_intention_using_machine_learning_algorithms.pdf (1.18 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 Presentation Intelligence Quantitative Standardized

沙发
nandehutu2022 在职认证  发表于 2022-4-26 11:28:21
天气因素对迁移意向的影响使用机器学习算法A预印本John AogaScience For Engineers博士学校BéAbomey CalaviAbomey Calavi大学ninjohnaoga@gmail.comJuhee斯维登朱希斯克夫德大学信息学院。bae@his.seStefanija弗兰切斯特法尼加雷恩大学CREM-UMR6211 Veljanoskacns。veljanoska@univ-rennes1。比利时新卢瓦因天主教大学。nijssen@uclouvain.bePierre比利时新卢瓦因天主教大学。schaus@uclouvain.beDecember2020年8月移民决策的变化。以前的文献得出了不同的结果,并使用了多种传统的实证方法。本文提出了一种基于树的机器学习(ML)方法来分析天气冲击对布基纳法索、科特迪瓦、马里、毛里塔尼亚、尼日尔和塞内加尔等六个依赖农业的经济国家的个人移民意愿的影响。我们使用列车验证测试工作流程来执行几种基于树的算法(例如XGB、随机森林),以构建鲁棒和抗噪声的方法。然后,我们确定重要的特征,这些特征显示了它们影响迁移意图的方向。

藤椅
大多数88 在职认证  发表于 2022-4-26 11:28:26
这种基于ML的估算考虑了不同时间尺度和各种社会经济特征/协变量的标准化降水蒸散指数(SPEI)捕捉到的天气冲击等特征。我们发现:(i)天气特征改善了预测性能,尽管社会经济特征对移民意向有更大的影响,(ii)国家特定模型是必要的,(iii)国际迁移受SPEI较长时间尺度的影响更大,而一般迁移(包括内部迁移)受较短时间尺度的影响更大。关键词移民·天气冲击·机器学习·基于树的算法1简介气候正在变化,其对人类流动性的影响是科学和政治议程的核心。移民与环境之间的密切关系并不是一个未知的现象,但气候变化的出现和加速使这种关系更加复杂。在过去十年中,将移民和气候变化联系在一起的文献显著增加(米洛克[26]、伯勒曼和斯坦哈特[6]、贝恩和朱塞特[5]、卡塔尼奥等人[13])。这些文献主要得益于气候和流动性指标的更高可用性和质量。他们的主要目标是研究气候事件在多大程度上引发甚至迫使个人迁移。尽管研究目标看似简单明了,但研究结果并未达成共识。arXiv:2012.02794v1[econ.GN]2020A年12月4日预印本-2020A年12月8日结果的异质性是因为使用了不同的测量方法、方法学方法和不同的计算方法(Beine和Jeusette[5])。

板凳
能者818 在职认证  发表于 2022-4-26 11:28:33
首先,研究结果在以下方面存在差异:(i)气候对移民的拉动或推动作用的影响方向,(ii)关系的强度,以及(iii)这种关系是有条件的,可以解释现有证据的这种差异。第三,这些发现是特定于环境的。例如,现有证据表明,气候-移民关系在发展中社会很常见,雨养农业部门在整体经济中占有重要地位。本文的主要目标是通过采用机器学习(ML)技术和大量气候和流动性测量,为这篇文献带来新的见解。继Bertoli等人[7]之后,我们关注西非地区,即布基纳法索、科特迪瓦、马里、毛里塔尼亚、尼日尔和塞内加尔。我们基于东安格利亚大学[22]的数据构建气候指标。与经济计量研究中使用的方法相比,其好处是减少了手动函数操作,减少了建模师专业知识引入的可能偏差。相反,ML模型基于数据集,可以被更多地视为“黑盒”方法。这种更高的容量有两个主要缺点。第一个问题是模型与数据过度匹配的风险。因此,ML方法通常将观察数据集拆分为所谓的训练集和测试集。第一个用于拟合模型,第二个用于评估学习模型的性能。ML方法的第二个缺点是它们生成的模型不易解释。虽然线性模型可以通过查看每个协变量系数的权重来轻松解释,但可以使用一些或逻辑公式来做出每个决策。

报纸
大多数88 在职认证  发表于 2022-4-26 11:28:39
一些方法被认为可以帮助用户解释ML模型,但总的来说,ML模型的行为仍然比线性方法更难解释。在各种各样的机器学习方法中,我们在这项工作中选择使用(集成)基于树的分类——决策树(DT)、随机森林(RF)和极端梯度提升(XGB)——原因如下。我们的结果/方法的再现性很重要,这些方法目前在大多数现成的数据科学工具或图书馆中都可用。这些方法已经存在了近二十年,在许多机器学习问题上都取得了优异的性能。它们仍然被认为是在机器学习竞赛中首先尝试的方法。这些方法不需要太大的数据集就可以得到好的结果,而且训练成本非常低。我们的贡献如下:使用ML的兴趣。我们提供了气候如何影响移民意向的证据我们向社会科学界提出了一个关于如何使用机器学习技术的ML工作流程。第2节介绍了这个问题,并根据我们使用机器学习(ML)方法(例如,决策树(DT)、随机森林(RF)和极端梯度提升(XGB))的动机列出了我们的问题。此外,第4节详细描述了数据集。然后,第5节描述了我们的实验和对研究问题的回答,第6节详细阐述了我们的发现和讨论。我们将在第7.2节概念框架2中完成本文。1.正式确定气候与移民之间的关系其他人,并不是最近才有的想法[]。建立这样的关系是一个长期的挑战。

地板
nandehutu2022 在职认证  发表于 2022-4-26 11:28:46
将气候影响与其他可能与之相关的影响(非气候)区分开来是一项挑战。气候迁移关系通常表示为确定一个未知的功能关系,f:yirkt=f(Crkt,Xirkt)。(1) Black等人[8]区分了迁徙、流离失所和不动,Beine和Jeusette[5]指的是“被困人口”。一份预印本——2020年12月8日,可从个人一级水平上获得的计划变量(X)到迁移结果(y)。在本文中,Yirktre描述了移民意愿,即移民到本地或国外。它是一个二元变量,包含实际迁移流量的信息[33]。Tjaden等人[33]验证了移民意向数据的有用性,尤其是在无法获得实际移民流动信息的情况下。Crkt(标准化降水蒸散指数)在区域层面提供(Vicente Serrano等人[35])。根据Vicente Serrano等人[35]的建议,概率分布用于标准化。有关PEI的更多详细信息,请参阅第4.2.1节。模型中考虑的其他变量代表与生活在一个国家的个人样本相关的人口统计学(如年龄、性别)和社会经济变量(如收入)。probit模型是用于估计方程(1)的传统方法之一。

7
可人4 在职认证  发表于 2022-4-26 11:28:52
其形式为:P(yirkt=1 | Crkt,Xirkt)=Φ(α+βCrkt+γXirkt)(2),其中β和γ是表征区域气候(Crkt)和个体协变量(Xirkt)对个体迁移意图的贡献和作用的参数。Φ(·)是累积标准正态分布函数。为了理解移民意向的气候决定因素,Bertoli等人[7]使用logit方法来估计移民意向决策,该决策取决于个人从选择不同的移民可能性或留在原籍地中获得的效用。这种效用类似于方程式(2),取决于区域气候和其他个人的人口和社会经济特征,并考虑时间和区域假人。这些意图的后一种,以及移动意图中的时间不变的空间异质性。该研究包括两个[7]对几个样本产生影响的迁移意图。该研究在第二阶段使用这些选定的变量来估计其参数以及对移民意向的影响方向。2.2决策树对线性模型的益处随着输入变量(协变量)数量的增加,发现最佳线性模型可能变得非常复杂。在Bertoli等人[7]中,作者报告了通过乘以和/或取多个变量的对数,在模型中添加一些手工术语(方程式(2))后进行的超过300000次回归。此外,如Bertoli等人[7]所做的那样,在没有训练/测试集方法的情况下对每个回归模型进行比较,可能会导致对更复杂的模型产生偏见,这些模型可能在看不见的数据上表现不佳。我们使用Bertoli等人[7]中描述的数据集进行了两项比较研究。比较两种不同的逻辑回归方法的预测能力:几种回归(如Bertoli等人。

8
大多数88 在职认证  发表于 2022-4-26 11:28:59
[7] )与单一回归(ML的方法)来检验它们的差异。2.树木)来检查问题的性质。图1(a)使用R平方测量比较了两种回归模型的预测能力。ML的逻辑回归(LR)在预测能力方面优于Bertoli等人[7](参考)的回归。因此,机器学习(ML)产生了更高的预测能力和更有趣的结果。来自ML方法的逻辑回归与Bertoli等人[7]中使用的回归之间的主要区别在于,来自ML方法的逻辑回归运行一个单一回归,包括所有特征或协变量,而在Bertoli等人[7]中,有多个回归运行(即,每个特征运行一次)。[7] 状态[]:1- LM/L,其中LM是模型的对数似然,lis是零模型的对数似然。空模型是一种模型,我们只从目标属性中学习,没有预测器。预印本——2020年12月8日●●●●●●●●●●●●国际行动总行动布基纳法索FasoIvory海岸MalimaritanigerSenegalburkina FasoIvory海岸MalimaritanigerSenegal0。000.050.100.15R平方●LR refer(a)逻辑回归:参数估计(refer)与机器学习(LR)视角下的国际移动一般移动训练设定值挫折海岸线。250.500.751.000.250.500.751.00精确度机器学习中的逻辑回归(LR)与决策树(DT)图1:比较模型对每个国家的预测能力,使用:(a)Bertoli等人[7]提供的逻辑估计的R度量(参考)和ML的逻辑回归结果(LR),以及(b)ML的逻辑回归结果(LR)和决策树(DT)的精确度度量。

9
nandehutu2022 在职认证  发表于 2022-4-26 11:29:05
在(a)中,布基纳法索的ML逻辑回归模型(LR)(一般移动)是空的,因为它不收敛。预印本——2020年12月8日。然而,应该注意的是,低R平方度量并不意味着模型的性能更差。根据优度检验,R平方非常低的模型可以很好地拟合数据。这满足了参数估计的目标,而在ML中,未知数据集/实例的性能更为关键。第二步,在数据集的一部分(即训练集)上训练模型。另一部分(即保持样本或测试集)用于测量模型对未知观测值的预测能力。有许多指标可以衡量模型的预测能力。第3.4节提供了指标的更多细节。精度值介于和之间,与R平方相同(值越高越好)。图1(b)显示了逻辑回归模型(LR)和决策树(DT)的精确度。DT在训练集和测试集上都优于LR。然而,当类别分布显示出严重的偏斜时,准确度并不是一个可靠的衡量标准(Branco等人[9])。但是,面对真实数据集的这种不平衡分布是很常见的(参见图4中的计数)。积极的移民意向(少数族裔)对我们的分析更为重要,但在第3.4节和第5节中,准确性对这个问题的影响较小。总的来说,基于树的方法可以更好地捕捉问题的非线性。通常,学习工作流程包括(i)考虑结果,选择适合问题的ML方法。

10
何人来此 在职认证  发表于 2022-4-26 11:29:11
然后,(ii)我们优化了方法的配置,以提高整体模型的预测能力。最后,(iii)我们解释模型的结果,以提供对问题的见解。[7] 该研究涉及在较长时间内不发生转换的实际SPEI值,并使用基于树的方法来预测迁移意图,并捕捉输入变量的非线性关系。2.3对于ML方法为了以更灵活的方法学方式理解气候、个体特征和迁移意图之间的联系,我们建议使用机器学习(ML)算法。这使得使用更大的数据集预测迁移意图成为可能,并从现有的可解释方法中找到影响特征(第3.5节)。我们首次发现了一种ML方法,该方法显示了稳健的预测性能(Q1)。此外,利用一个包含六个不同国家移民意向调查的天气冲击和个人特征的大型数据集,对预测性能进行统计比较,以发现天气(第二季度、第五季度)、个人特征(第三季度、第四季度)和国家(第三季度、第四季度)的影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 03:53