人大经济论坛 › 论坛 › 经济学人二区 › 外文文献专区 › 稳健生产率分析：德国FADN数据的应用

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 3 下一页

发帖

楼主: 何人来此

329 20

[量化金融] 稳健生产率分析：德国FADN数据的应用 [推广有奖]

0关注
3粉丝

会员

学术权威

79%

还不是VIP/贵宾

威望: 10 级
论坛币: 10 个
通用积分: 61.8334
学术水平: 1 点
热心指数: 6 点
信用等级: 0 点
经验: 24791 点
帖子: 4194
精华: 0
在线时间: 0 小时
注册时间: 2022-2-24
最后登录: 2022-4-15

楼主

何人来此

发表于 2022-6-11 13:54:59 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

英文标题：
《Robust Productivity Analysis: An application to German FADN data》
---
作者：
Mathias Kloss and Thomas Kirschstein and Steffen Liebscher and Martin
Petrick
---
最新提交年份：
2019
---
英文摘要：
Sources of bias in empirical studies can be separated in those coming from the modelling domain (e.g. multicollinearity) and those coming from outliers. We propose a two-step approach to counter both issues. First, by decontaminating data with a multivariate outlier detection procedure and second, by consistently estimating parameters of the production function. We apply this approach to a panel of German field crop data. Results show that the decontamination procedure detects multivariate outliers. In general, multivariate outlier control delivers more reasonable results with a higher precision in the estimation of some parameters and seems to mitigate the effects of multicollinearity.
---
中文摘要：
实证研究中的偏差来源可以分为来自建模领域的偏差（例如多重共线性）和来自异常值的偏差。我们提出了两步解决这两个问题的方法。首先，通过多元离群点检测程序消除数据污染，其次，通过一致地估计生产函数的参数。我们将这种方法应用于一组德国田间作物数据。结果表明，去污程序可检测多变量异常值。一般来说，多元离群值控制在某些参数的估计中提供了更合理的结果和更高的精度，似乎可以减轻多重共线性的影响。
---
分类信息：

一级分类：Economics 经济学
二级分类：General Economics 一般经济学
分类描述：General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类：Quantitative Finance 数量金融学
二级分类：Economics 经济学
分类描述：q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学，包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载：
-->

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Fad 生产率 Multivariate Collinearity Contribution

相关帖子

• 【火热报名中】CDA数据分析认证考试

使用道具举报

沙发

kedemingshi

发表于 2022-6-11 13:55:04 |只看作者 |坛友微信交流群

稳健的生产率分析：German FADN dataMathias Kloss的一个应用程序*Thomas Kirschstein+Ste ffen Liebscher+Martin Petrick*2019年2月14日实证研究中的偏差来源可分为来自建模领域的偏差来源（如多重共线性）和来自异常值的偏差来源。我们建议采用两步方法来解决这两个问题。首先，通过多元离群点检测程序消除数据污染，其次，通过一致地估计生产函数的参数。我们将此方法应用于德国油田cropdata小组。结果表明，去污程序可检测多变量异常值。一般来说，多元离群值控制在某些参数的估计中提供了更合理的结果和更高的精度，似乎可以减轻多重共线性的影响。关键词：生产率分析、异常值检测、FADN、德国*莱布尼茨转型经济体农业发展研究所（IAMO），Theodor Lieser Strasse2，D-06120，Halle（Saale），德国+马丁·路德大学Halle Wittenberg，Grosse Steinstrasse 73，D-06099 Halle（Saale），德国1简介和背景在评估要素生产率时，偏见主要来自两个不同的来源。第一个来源是关于生产函数参数的经典识别问题。投入通常取决于农民的决策过程。因此，由于投入选择的内生性，存在一个内生性问题（Griliches和Mairesse，1998）。此外，由于各企业的要素利用率没有变化，OLS和固定效应等标准估计程序无法提取单独识别不同产出弹性所需的信息。这导致了共线性问题（Ackerberg等人，2007）。

使用道具举报

藤椅

kedemingshi

发表于 2022-6-11 13:55:07 |只看作者 |坛友微信交流群

最近，人们对这两个问题有了新的认识，并制定了有希望的方法来缓解它们（参见OlleyandPakes，1996；Blundell和Bond，2000；Levinsohn和Petrin，2003；Wooldridge，2009；Gandhi等人，2011）。然而，即使在统计识别得到保证的情况下，数据本身也可能产生偏差。如果数据集中存在异常值，通常会发生这种情况，这是许多真实世界数据集普遍存在的特征，因此在许多实证应用中也是一个问题。如果不处理离群值，估计值可能会因数据集中仅存在一个离群值而被任意掩盖。此外，在估计要素生产率方面，考虑异常值可确保保持同质生产技术的假设。在本文中，我们关注后一种偏差来源，同时处理生产函数估计器，该估计器控制给定的识别问题。异常值的出现，例如由于测量误差、数据生成过程中的变化或误报。一般而言，除了非常务实且不进行任何异常值净化外，对于如何定义并识别异常值，存在两种一致的观点。一方面，有一些方法假设一个严格的统计模型，例如，在某种意义上，离群值被认为是来自不同分布的数据（来自研究人员实际感兴趣的另一个分布）。整个数据可以理解为两个（或多个）分布的混合，其中目标分布应该包含概率质量的大部分（相比之下，如果离群值占大多数，那么谈论离群值就没有多大意义。在这种情况下，离群值应该被视为兴趣分布）。

使用道具举报

板凳

mingdashike22

发表于 2022-6-11 13:55:10 |只看作者 |坛友微信交流群

属于该类别的方法通常旨在估计目标分布的某些特征，而异常值检测通常不是其主要目标（它更多的是一种固有的副产品）。如果识别出异常值，则会将其与该精确模型联系在一起，这意味着当基础（分布）假设未完全满足时，该类别中的方法无法合理应用（在这种情况下，至少无法预期任何有用的结果）。在这一类中，可以找到各种模型的一系列稳健估计量，如Rousseeuwand Leroy（1987）；Barnett和Lewis（2000）；Hampel等人（2005年）；Maronna等人（2006年）；Huber和Ronchetti（2009）对此类方法的概述。另一方面，有一些方法在如何确定离群值方面遵循更为面向样本的观点。通常，所有这些方法都将异常值解释为与目标观测值不同的观测值。显然，对于如何量化这种差异，存在着许多建议。这些方法中的很多都是基于一些不执行任何离群值控制是一种常见做法（见第2节）。距离的类型，可以是任意两个观测值之间的距离，也可以是相对于某个参考点的距离，但也有其他方法，例如基于深度或经验密度的距离。主要可以在计算机科学和数据挖掘文献中找到代表，参见。g、 Chandola等人（2009年）及其参考文献作为起点。使用这些方法，主要目标确实是识别异常值。不过，仍可能对已识别的非异常值进行额外分析。

使用道具举报

报纸

mingdashike22

发表于 2022-6-11 13:55:13 |只看作者 |坛友微信交流群

属于这一类别的方法的最大优点是，它们通常可以应用，而不局限于某些分布假设已完成的情况。一般来说，正如我们通过评估实证经济学论文样本发现的那样，如果进行ADE污染，则在后续分析之前，几乎总是采用单变量方法，重点是更复杂的多变量模型中的一个变量。然而，这种方法忽视了模型的多元性。在本文中，我们基于“农场会计数据网络”（FADN）数据集，提出了一种稳健的两阶段方法，用于估算东德和西德农田作物农场的生产函数。首先，通过执行异常值去污，然后通过估计生产函数的参数。虽然关于异常值检测方法的文献非常丰富（Maronna等人，2006年），其他方法也可能可行（如聚类分析），但我们采用Kirschsteinet等人（2013年）提出的多元去污程序来识别异常值。该方法已在确定不成功军舰设计的应用中证明了其有效性（Liebscher和Kirschstein，2012）。此外，它是一种非参数方法（不需要特殊的分布假设），并且具有计算优势（尤其是对于分析的大型数据集），这使它成为我们的首选。净化后，我们使用Wooldridge（2009）工具变量估计器估计生产函数的参数，以解释内生性和共线性问题。

使用道具举报

地板

何人来此

发表于 2022-6-11 13:55:15 |只看作者 |坛友微信交流群

虽然我们考虑生产函数的估计，但这些见解也应该与其他模型驱动的实证应用相关，在这些应用中，数据受到异常值的污染，以及那些执行结构变量估计的应用。论文进行如下。在第2节中，我们讨论了实证经济学中异常值处理的现行做法。接下来，我们介绍方法学背景。首先，通过讨论我们的异常值识别方法。其次，介绍了生产函数估计所采用的方法。在此阶段，我们还通过示例说明了数据中存在异常值时对生产函数估计的影响。第4节讨论了FADN数据。我们继续介绍我们的结果。第6节总结了本文。2实证经济学实践为了全面了解如何在经济学领域内处理异常值，我们调查了另外两个数据源的研究，这两个数据源在农业经济学中的重要性与我们的数据源“农场会计数据网络”（FADN）大致相同。对于FADN数据，我们回顾了欧盟委员会根据FP7资助的两个最新研究项目的研究，其中大量使用了该数据集：“欧洲农业的农场会计成本估算和政策分析”（FACEPA）和“要素市场”。对于发展经济学领域，我们审查了世界银行“生活水平测量调查”（LSMS）研究的工作文件，而对于一般经济学领域，我们分析了使用“德国社会经济委员会”（GSOEP）数据的研究。GSOEP的“SOEPapers”系列就是此类工作的集合。

使用道具举报

7楼

何人来此

发表于 2022-6-11 13:55:18 |只看作者 |坛友微信交流群

在表1中，我们总结了针对这三个数据源的实证工作样本的异常值处理的现行实践。通常，这三个数据源将评估和异常值处理留给研究者（Grosh和Munoz，1996；Haisken DeNew和Frick，2005；欧盟委员会，2010）。LSM的Grosh和Munoz（1996，第125页）明确表示对这一观点持开放态度，他们解释说“这些问题的进一步处理应该留给分析师，因为这些问题没有普遍接受的解决方案”。这一论点为研究人员处理异常值提供了许多可能性。在这些来源的经验性经济文献中，大量作者通过视觉观察和上下文推理来评估离群值，视觉观察通常只适用于较小的数据集和二维。基于这些操作模式，他们减少了难以置信的案例（例如，Deaton，1981年、1988年；Crosetto和Filippin，2012年；Obschonka等人，2013年；Oltmanns等人，2014年；Auer和Danzer，2014年）。其他方法包括变量转换（例如对数化）、影响度量的应用或极值的审查（参见Schneck，2011；Olper等人，2014；Liverpool-Tasie等人，2015）。一些作者删除了异常值，但没有说明其检测方法（如Bauernschuster等人，2011；Ciaian等人，2011；Lang，2012；Kemptner，2013；Arnold等人，2014）。更结构化的方法采用两步程序，首先在进行所需分析之前识别并去除目标变量（单变量异常值）的极端观测值。在所有经验数据源中，最常用的方法是“修剪”，要么删除某个百分比的数据（通常为1%或5%），该百分比位于分析中心的单个单变量测度分布的顶部和/或底部，要么应用基于量化的规则，例如：。

使用道具举报

8楼

kedemingshi

发表于 2022-6-11 13:55:22 |只看作者 |坛友微信交流群

上/下四分位±s·IQR，s是一些比例因子和IQR的四分位范围（例如，Pfei ffer和Schulz，2011；Zibrowius，2012；Schmitt，2013；Sorgnerand Fritsch，2013；Guastela和Moro，2013；Oseni等人，2014；Murphy和Oesch，2015；Avdic和Bünnings，2015；Backiny Yetna和McGee，2015）。然而，单变量异常值识别方法忽视了多变量数据的性质。最引人注目的是，没有提及任何异常值控制的论文数量最多（例如，皮特，1995年；奥尔德曼，1998年；鲍尔等人，2011年；Carletto等人，2011年；Headeyet等人，2012年；Dustmann和g"orlach，2015年；Schuer，2015年）。例如，在我们从SOEPapers数据库（2011-2015年期间）审查的396项研究中，只有8.6%的样本提到了异常值控制。另一种方法是将离群值问题直接纳入估计器（即通过开发或应用稳健估计器）。Hübler（2012）应用了一个简单的分位数回归估计。这样，通过使用适当的估计方法来解释异常值。然而，考虑到辅助变量问题的估计，这种方法是不可行的，因为它没有考虑内生性和共线性问题。

使用道具举报

9楼

mingdashike22

发表于 2022-6-11 13:55:25 |只看作者 |坛友微信交流群

要开发一个能够处理内生性和共线性问题的稳健性估计器，需要进行广泛的工作，这超出了本文的范围。另一种两步方法，也是迄今为止我们所知的唯一一种，使用FADN数据以多元方式解释异常值，已在FACEPATable 1：实证经济学中的异常值处理FADN LSMS GSOEPSamplecompositionFACEPA（2009-2011）中使用；FactorMarkets（2011-2013）世界银行LSM（1980-2002）和政策研究工作文件（2010-2015）SOEPapers（2011-2015）调查研究数量36 129 396处理异常值的研究数量11(≈ 30.6%) 23 (≈ 17.8%) 34 (≈ 8.6%）显性去污方法单变量单变量常用方法和示例（Guasteland Moro，2013；Petrick and Kloss，2013），无方法说明（Bakucs et al.，2010；Ciian et al.，2011），视觉观察（Deaton，1981，1988），修剪（Oseni et al.，2014；Backiny Yetnaand McGee，2015），异常值审查（Liverpool Tasie et al.，2015）视觉观察（Crosetto and Filippin，2012；Obschonka et al.，2013），Trimming（Pfei Offer and Schulz，2011；Murphy andOesch，2015），Nomethod stated（Lang，2012；Arnold et al.，2014）来源：作者。项目（Bahta等人，2011年）。他们的检测程序采用了Rousseeuw（1985）提出的最小协方差确定（MCD）算法。然而，这种方法对数据施加了严格的分布假设。此外，他们的估计程序没有考虑农场特定的异质性。总之，在大多数研究中，未提及异常值控制。在那些提到去污程序的研究中，以单变量方法为准。3方法为了进行无偏估计，我们分两步进行。首先，我们通过修剪最小生成树（Kirschstein et al.，2013）从异常值中净化样本。

使用道具举报

10楼

mingdashike22

发表于 2022-6-11 13:55:27 |只看作者 |坛友微信交流群

在消除数据中的异常值后，我们继续使用Wooldridge（2009）生产函数估计器估计生产函数。在接下来的小节中，我们详细描述了这两种方法。我们通过用模拟数据演示异常值对生产函数估计的影响来结束本节。3.1通过修剪最小跨度Treerobrast进行去污统计方法旨在提供存在受污染数据集的感兴趣度量的无偏估计。因此，一般的两步方法是首先确定无离群值的子样本。这一步骤可称为去污。反过来，不属于未污染子样本的观测值被怀疑是异常值。与离群点检测方法不同，这种方法试图找到一个无离群点的子样本，而不是离群点。通过这种方式，我们接受了错误地放弃非外围观测而支持（很可能）无异常值子样本的风险。依赖非参数去污程序的稳健估计器是pMSTestimator，它是多变量位置和散射的稳健估计器（Kirschstein et al.，2013）。去污是对数据集的最小生成树（MST）进行修剪的结果。其思想是，数据集的每个观测值表示欧几里德空间中的一个点，其坐标是观测值在每个维度上的值。请注意，在面板数据上下文中，观察值对应于数据库中的一个条目，例如某一年农场的劳动力、土地、材料和资本使用记录。为了将观测值限定为外围观测值，pMST程序意味着相对于类似观测值隔离异常值。相似性定义为两个观测值之间的欧几里德距离。

使用道具举报

返回列表

12 3 下一页

发帖

本版微信群

加JingGuanBbs
拉您进交流群

手机版 |

意见反馈 |

帮助 |

新手入门 |

用户手册 |

友情链接 |

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[量化金融] 稳健生产率分析：德国FADN数据的应用 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群