|
114).3.3艺术示例为了证明异常值对非稳健估计的影响,我们讨论了一个简化示例。因此,我们模拟了一个7个周期内100个农场的示例。这些观测值的数据生成过程如下:yit=0.4·lit+0.6·kit+ωi+εit,(7)其中y、l和k是输出、劳动力和资本的自然对数,ωi表示观察到的异质性与ωi~ N(0,25)和ε是N(0,1)之后的剩余扰动。劳动力和资本投入是N(0,4)的随机变量。作为离群值,我们用ωi生成两个数据集,其中20个小农场在同一时期~ N个(-5、4)和lit,套件~ N个(-5, 9). 此附加数据将添加到“原始”样本中。最后,我们得到了两个不同的异常值污染数据样本。在第一个异常值数据集中,我们将cor(lit,kit)=0(样本I),并在第二个cor(litkit)≈ -1(样本II),因此劳动力和资本几乎是(完美的)替代品。已选择该假设。注意,(5)中的正交性条件在某种程度上被削弱,即仅假设当前实现和输入的一个滞后与εit/eit不相关。用于演示目的。请注意,我们以这种方式进一步区分,以说明多重共线性对异常值感染数据的影响,以及异常值净化如何能够缓解这种影响。在这两个样本中,异常值集的生产函数为:yit=0.99·lit+0.01·kit+ωi+εit。(8) 即,在两组中,7·20=140个观测值由(8)生成,这些观测值被视为来自(7)中假设的过程。我们给出了固定效应回归结果,以控制所有三个数据集未观察到的农场特定效应(ωi),应用a)无去污,b)单变量异常去污,以及c)使用pMST方法的多变量去污。
|