楼主: 大多数88
2791 99

[经济学] 估计天气对农业的影响 [推广有奖]

31
能者818 在职认证  发表于 2022-4-26 15:46:58
农业总产值的平均值从最低的168美元(乌干达)到最高的664美元(尼日利亚)不等,大多数国家的产值在100美元到300美元之间。尽管农场规模存在巨大差异,但农场总产量的价值并不是特别具有信息性。平均而言,埃塞俄比亚、马拉维和坦桑尼亚的农场往往规模较小——不到两公顷(公顷)。相比之下,乌干达的平均农场面积超过5公顷,尼日尔的平均农场面积为11公顷。由于这些差异,尼日尔的农场平均产量在LSMS-ISA国家中最低,每公顷价值仅为60美元。相比之下,尼日利亚的农场平均每公顷产值为680美元。各国的劳动力也存在巨大差异,埃塞俄比亚的农场平均每公顷使用434天,而尼日尔的农场每公顷使用不到100天的劳动力。同样,各国的肥料使用率也各不相同,乌干达平均每公顷使用不到1千克,而尼日利亚平均每公顷使用近100千克。就其他购买的投入而言,尼日利亚的农场往往比其他国家应用得更多。尼日利亚约20%的农民使用农药和除草剂,而其他大多数国家不到10%的农民使用这些化学品。所有货币价值均按当前汇率换算成美元,然后升值/贬值至2010美元。我们使用世界银行发展指标(上一次更新日期为2020年4月9日)的数据来计算汇率和汇率换算。在发展中国家,灌溉水平非常低,通常不到5%。B组提供了主要作物产量的汇总统计数据(尼日尔的小米、其他国家的玉米)。我们进行的全国农业总产量比较中的模式主要体现在初级作物产量的比较中。

32
nandehutu2022 在职认证  发表于 2022-4-26 15:47:04
平均而言,尼日利亚的收成最大,产量最高,购买的化肥、农药和除草剂等投入使用量最高。平均而言,尼日尔的主要作物专用土地面积最大,埃塞俄比亚平均每公顷消耗的劳动力最多。乌干达的平均收成和产量最低,施肥量也最少。由于农场总价值以恒定美元表示,主要作物价值以千克表示,我们无法直接比较大多数价值。然而,我们可以将农场的土地面积与主要作物的土地面积进行比较。在埃塞俄比亚、尼日利亚和乌干达,主要作物的土地面积约占农业总面积的30%,这意味着生产方式相当多样化。相比之下,马拉维的主要作物玉米占农田总面积的92%,这表明马拉维农业高度专业化。尼日尔(44%)和坦桑尼亚(58%)介于这两个极端之间。与多样化农业生产相比,相对专业化程度(单一种植)对使用遥感天气数据预测农业生产以及作为其他经济指标的工具具有影响。在马拉维,92%的农场都致力于生产单一作物,因此很容易确定单一的降雨和温度变量,从而很好地预测产量。然而,在高度多样化的农业环境中,如埃塞俄比亚、尼日利亚和乌干达,可能很难找到一组预测结果的变量,因为与玉米产量高度相关的降雨量和温度指标可能与咖啡、木薯或豆产量无关。

33
kedemingshi 在职认证  发表于 2022-4-26 15:47:11
在选择天气指标来代表经济结果时,需要考虑多种作物-天气关系,这是文献中没有充分讨论的问题。3分析工厂以下分析及相关结果在我们的预分析计划(Michelet al.,2019)中预先规定,并在开放科学框架(OSF)中注册。如果方法、途径或差异标准与我们的计划不同,我们将强调这些差异。由于我们计划中的这些偏差而产生的结果应被解释为探索性的。3.1我们的基本模型规格估计遵循Desch^ene and Greenstone(2007):Yht=αh+γt+Xhtπ+JXjβjfj(Wjht)+uht(1),其中Yht是上述LSMS-ISA中针对家庭h的结果变量,Xht是LSMS-ISA中的输入变量矩阵。我们控制年度固定效应(γt),并将家庭固定效应(αh)包括在一些规范中。函数fj(Wjht)表示感兴趣的天气变量,其中j表示特定的天气测量。最后,Uhts是一个在家庭层面聚集的特殊错误术语。根据这一总体设置,我们估计了该模型的六个版本:三个线性版本和三个二次版本。对于每个模型,只考虑一个天气变量。对于线性规范:Yht=βWht+uht(2a)Yht=αh+γt+βWht+uht(2b)Yht=αh+γt+Xhtπ+βWht+uht(2c)对于二次规范:Yht=βWht+βWht+uht(3a)Yht=αh+γt+βWht+βWht+uht(3b)Yht=αh+γt+Xhtπ+βWht+uht(3c)对于每个排列的数据,都对所有回归模型进行了估计(见表5)。考虑到确定的变量数量(14个降雨、8个温度变量)、国家数量(6个)、遥感产品数量(6个降雨、3个温度)、提取方法数量(10个)和结果数量(2个),这是大量回归。

34
kedemingshi 在职认证  发表于 2022-4-26 15:47:17
这给了我们总共77760个不同的回归:我们的六个模型中的每一个都在12960个不同的数据集上。通过改变规格和数据,我们试图通过结合Simonsohn等人(2020年)的多重分析方法和Steegen等人(2016年)的多重分析方法来确定一组可靠的结果。在相关情况下,LSMS-ISA中的所有连续变量都使用逆双曲线进行对数变换。我们还测试了一系列51840个温度和降雨数据的线性组合,用于降雨和温度天气产品的每个可能组合(六个降雨数据产品和三个温度数据产品)。对于同一种提取方法,我们只测试降雨和温度的组合。对于线性组合,我们用线性规格估计每个组合,但用二次规格估计两个线性组合。附录F中给出了这些结果。77760个标准回归加上51840个线性组合,我们总共得到了本文中给出的129600个回归结果。3.2推论在典型的经济学论文中,实证结果将以表格形式呈现,其中包括有效估计和一些用于推断的统计数据,如标准误差、p值、t统计数据或置信区间。在我们的例子中,由于我们估计了大量的回归,标准的推理模式和结果的传统呈现方式是不合适的。相反,根据我们的预分析计划,我们依靠一系列方法和标准进行推理、评估结果,并展示我们的发现。由于没有正式的统计测试来比较不同模型的结果,我们开发了三种启发式方法来描述结果中的相似性和差异。

35
kedemingshi 在职认证  发表于 2022-4-26 15:47:23
在描述这些启发法之前,反思一下启发法需要具备哪些特征才能用于我们的目的(即,在数万个模型中进行比较)是很有用的。首先,我们测试的一些天气指标可能与结果(平均降雨量)正相关,而其他指标可能与结果负相关(最长干旱期)。因此,启发式应该是不可知的,关于系数的符号。其次,我们的先验知识是,无论方向如何,天气都与结果显著相关。这一假设是基于经济学文献中天气预报用于预测各种结果的频率,从作物生产到移民再到经济增长。因此,我们需要一种能够确定天气指标何时与结果显著相关,何时与结果不显著相关的启发式方法。最后,与我们之前的结论一致,我们希望天气能够减少模型中无法解释的方差,其他一切都是一样的。因此,我们需要一种启发式方法,可以在控制天气后测量模型中无法解释的方差。考虑到这三个特点,我们采用三个通用指标来评估我们的结果,并采用两种方法来测试这些指标之间的差异。这三个指标是(1)平均调整值,(2)在标准水平(0.01、0.05和0.10)显著的系数p值份额,以及3)95%置信区间的系数。为了比较回归中的指标,我们采用了两个测试:1。弱差异检验:一个模型的结果值(经均值调整的R、显著值的份额或系数)不在竞争模型结果值的95%置信区间内。置信区间可能重叠。2.

36
何人来此 在职认证  发表于 2022-4-26 15:47:29
强差异检验:根据我们的预分析计划,一个模型的结果值(经均值调整的R、显著p值的份额或系数)的95%置信区间不在95%范围内,我们打算在Sala-i-Martin(1997年b,a)之后检查系数估计的CDF。然而,在我们的环境中使用这种方法并没有产生有用的结果。因此,我们将根据规格图中系数估计的大小来绘制系数和置信区间。虽然与Sala-i-Martin(1997a,b)中的系数CDF不同,但这些图传达的信息大致相同,更适合于与该分析相关的度量、数据产品、提取方法等的变化。竞争模型结果价值的置信区间。信任区间不能重叠。我们的方法建立在Levine和Renelt(1992)估算差异评估的极端界限方法和Sala-i-Martin(1997b,a)中可视化这些差异的图形方法的基础上。虽然这三个指标都是正式的统计数据,但我们的弱测试和强测试都不是,我们不会这样对待它们。相反,我们使用指标和非正式测试的组合作为启发,来评估什么天气指标重要,对于什么国家,来自什么遥感产品,以及来自什么提取方法。同样,由于我们缺乏关于每个数据源试图测量的客观事实的数据,因此一个模糊处理/度量/源组合的所有比较都是相对于不同的模糊处理/度量/源组合进行的。我们的数据和启发法不允许我们就遥感源的准确性提出主张。

37
nandehutu2022 在职认证  发表于 2022-4-26 15:47:35
相反,我们通过将每种产品的结果与其他来源的结果进行比较,量化遥感数据中测量误差的重要性和大小。我们始终牢记,对于一个给定的国家和地区,如果没有测量误差,那么无论混淆/源组合如何,数万次回归的结果都将完全相同。关于我们的结果,以及所有集中在P值上的结果,需要记住的一个重要警告是,点估计的重要性并不意味着模型是正确的,点估计在农业上有意义,或点估计有正确的符号。很可能的情况是,温度的倾斜对农业生产无关紧要,因此导致显著系数的遥感产品是有测量误差的产品,而不导致显著系数的产品是更精确的产品。这些结果和相关图表使我们能够直观地看到这些感兴趣的物种中重要系数数量的可变性。结果中的任何变化都表明,混淆/源组合提供了不同的天气测量,因此存在测量误差。4结果由于我们的分析产生了大量的回归和估计值,我们没有像传统经济学论文那样展示我们的结果,系数、标准误差和代表p值的星星都在对应于每个回归的表格中报告。

38
mingdashike22 在职认证  发表于 2022-4-26 15:47:41
取而代之的是,我们提供了一系列图表,这些图表使我们能够根据我们的启发,评估遥感天气数据中各种测量误差来源的影响的重要性和大小。我们首先检查由于用于保护家庭隐私的提取方法而产生的测量误差。然后,我们检查测量误差与测量降水量和温度的天气指标的选择有关。最后,我们调查了特定遥感产品误测降水和温度的程度。4.1提取方法我们首先根据假设1检查提取方法(H-为保护农场或家庭隐私而实施的不同模糊程序对农业生产力的估计没有影响)。我们的无效假设基于两个假设。首先,现有的可公开获取的遥感天气产品分辨率太低,任何提取方法都无法对一个家庭最终的像素产生显著差异。第二,即使使用模糊技术将一个家庭位置从一个像素移动到另一个像素,天气在空间上也有充分的相关性,因此这种移动并不重要。另一种假设是,混淆住宅区的真实GPS坐标会导致大量误测,导致研究人员将混淆的坐标与网格化遥感数据相匹配,而网格化遥感数据不会准确反映住户所经历的真实天气。为了验证假设1,我们将77760个回归(不包括线性组合的回归)的结果汇总在一起,然后将这些结果分成十个箱子,每个箱子对应一种提取方法。然后计算每个结果的描述性统计数据。其中包括p值为p>0.90、p>0.95或p>0.99的平均校正右旋值和系数(β)份额。

39
大多数88 在职认证  发表于 2022-4-26 15:47:47
对于这些值中的每一个,我们计算平均值的95%置信区间。然后,我们比较所有十种提取方法的均数校正右值或p>0.95s的份额,并使用平均值的95%置信区间,使用我们的弱和强测试标准评估差异。这反过来又让我们能够对我们的假设做出判断:如果证据的优势使得我们在我们的启发中没有发现差异,那么我们无法拒绝零,并得出结论,家庭GPS坐标的混淆不会在分析中引入实质性的误判。或者,如果证据的优势使得我们的启发法存在弱或强差异,那么我们拒绝接受空值,并得出结论,模糊处理确实会在分析中引入测量误差。4.1.1调整后的RWe使用规格图检查十种提取方法的调整后右值。图8显示了平均值提取法95%置信区间的平均值调整Rand。我们进一步按模型规格对结果进行分类,因为有协变量或固定效应的模型与没有协变量或固定效应的模型具有不同的调整后右旋值。图8的西北面板显示了模型规格(2a)和(3a)的结果,这两个模型是线性和二次模型,没有协变量,也没有住户。我们还创建了图表,通过提取方法检查系数(β)的差异及其相对重要性。为了节省开支,由于这些信息没有透露任何进一步的信息,它们在附录图C1到图C6中给出。固定效应。东北面板显示了模型规格(2b)和(3b)的结果,其中包括家庭固定效应,但不包括协变量。西南面板显示模型规格(2c)和(3c)的结果,其中包括固定效应和协变量。

40
kedemingshi 在职认证  发表于 2022-4-26 15:47:53
规格图中每个“列”的顶部是平均值调整后的Rand,即1296次回归的平均值的95%置信区间。下图显示了与统计数据相关的提取方法和模型规格。首先考虑西北面板:模型规范中的交叉提取方法(2a)与平均调整后的右旋糖酐值没有实质性差异。与任何其他提取方法相比,任何提取方法的平均校正右旋值均未通过我们的弱或强差异测试。同样,当在模型规范(3a)中比较跨提取方法时,平均值调整后的Ris与任何其他Ris没有弱或强差异。虽然不是正式的统计测试,但我们的启发式方法无法拒绝这两个模型规格的空值。我们对东北和西南面板中显示的提取方法和模型规格的结果进行了相同的练习。与第一个面板一样,任何一种提取方法的平均校正右旋值与任何其他方法既没有弱差异,也没有强差异。我们的启发式算法无法拒绝任何模型规格的空值。基于此,我们得出结论,任何一种提取方法的遥感天气数据都不能解释我们的结果变量相对于任何其他提取方法的大量差异。尽管未能基于强标准或弱标准拒绝空值,但提取方法导致最大调整右值的模式非常一致。家庭坐标、EA中心点和修改后的EA中心点的双线性提取方法通常构成前四个模型中的三个。回想一下,双线性方法计算四个最近的细胞中心的距离加权平均值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-7 20:32