楼主: 何人来此
1940 29

[经济学] 半参数贝叶斯广义最小二乘估计 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-4-24 14:36:53
σ=σ,(16)式中“” 代表Kronecker产品。我们可以用这个协方差矩阵变换观测值,使误差遵循标准正态分布N(0,1),参数的似然、先验和后验定义与方程(9)至(13)类似。3.1 sur的先验DP尽管sur模型考虑了误差的交叉方程相关性,如Wooldridge(2003)所述,假设误差分布相同。此外,与经典的gls估计不同,这种分布通常被假定为正态分布。在本节中,我们提出了一种新的dp-sur方法,该方法不对误差分布族进行先验假设。如果我们允许每个观察都有自己的协方差矩阵,那么如果我们只有横截面数据,误差分布的灵活性将导致识别问题。将观察结果分组代表一种折衷。给定(15),观测i的误差协方差矩阵由∑i给出=σ*11,ciσ*12,ciσ*21,ciσ*22,ci, s、 t.σ*12,ci=σ*21,ci,(17)其中cidenotes是观察i的组id,上标* 表示集团特定参数。对于ci=cj,i,j∈ {1,2,…,N}观测值i和j共享同一个群,但协方差矩阵Ohm 具有(16)中的特定形式,而不是协方差矩阵的一般正有限对称形式。和超参数,比如σ*pq,ci=σ*pq,cj,其中p,q∈ {1,2}为系统中的方程编制索引。假设已知群的数目,可以使用狄里克莱先验进行混合。限制性较小的方法使用非参数方法,在(8)中为∑ias的分布引入aDP先验。

12
mingdashike22 在职认证  发表于 2022-4-24 14:36:59
多元正态分布的协方差矩阵的基分布和共轭先验的自然选择,逆Shart分布,即F≡ IW(ν,W)(18)式中,ν,W是逆Wishart分布的超参数。给定(18)每个∑iis的后验分布也逆Wishart,这很容易通过使用Gibbssampler得出。与参数贝叶斯sur的主要区别在于(17)中给出了每个观测值的协方差矩阵,这使得每组观测值都有自己独特的参数值。3.2 MCMC AlgorithmA Gibbs采样器(见Geweke,1996)可用于sur模型。吉布斯采样器从其后验值中提取两组参数:误差的协方差矩阵∑和回归参数β,即∑y,X,β(19)β| y,X,∑。(20) 在引入包含DP先验的层次结构时,mcmc算法中包含了一些额外的参数。这些是误差的协方差矩阵,Θ={∑i},和α,DP先验的浓度参数。吉布斯取样器现在由Θy,X,β,α(21)β| y,X,Θ,α(22)α| y,X,β,β组成。(23)两个吉布斯取样器之间的主要差异在于(19)和(21)。在(19)中,误差具有相同的协方差矩阵∑。相比之下,将会有K≤ NΘ不等式(21)中的唯一值,因为在DP先验下F的离散性;将∑i值相同的观测值分配给同一组。通过最后一次绘制β,可以获得残差,作为绘制Θ的数据。在使用(23)绘制浓度参数α时,我们采用Conley等人(2008)引入的DP先验,即P(α)∝1.-α - αminαmax- αminτ、 (24)式中,αmin和αmax是α的预设下界和上界。α越大,平均产生的群体越多,即。

13
mingdashike22 在职认证  发表于 2022-4-24 14:37:04
DP不那么离散。根据Antoniak(1974)中以α为条件的群K的数量分布,我们可以通过将群的数量模式设置为Kmin和Kmax来确定αmin和αmax。在本文中,我们假设Kminbe 1和Kmaxbe为观测数的5%。根据Conley等人(2008)的建议,我们将τ设置为0.8。超参数αmax已根据样本量的10%和50%进行调整。在我们的实验中,结果对浓度参数α之前的超参数变化不敏感。3.3模拟实验在本节中,我们进行了模拟实验,旨在将我们的方法与第3节中描述的贝叶斯sur进行比较。由于本文的主要关注点是相对于gls型估计器的潜在效率增益,我们评估了dp sur和正态Bayesian的性能,重点是这两种方法估计的参数的后验标准差。所有模拟实验均基于(14)中的两方程组。这些实验旨在突出估计量在以下维度上的性能:(i)误差的异质性;(ii)误差分布的尾部;(iii)样本量。对于(i)我们对照一个误差分布为i.i.d.多元正态分布的模型检查我们的dp sur方法的性能。在异质情况下,最直接的方法是从多元正态分布的混合中产生误差。

14
kedemingshi 在职认证  发表于 2022-4-24 14:37:10
然而,我们使用多元t分布(Andrews and Mallows,1974)利用正态分布与逆Wishart协方差矩阵的比例混合。为了适应(ii),我们改变了多元t分布的自由度(df)。较小的自由度会导致较重的尾部,这表明较大比例的观测遵循正态分布,即较少集中在平均值周围。为了确定我们方法的稳健性,我们进行了一组模拟,其中误差服从对数正态分布。对数正态分布在实证研究中有着广泛的应用。例如,人们已经证明,收入服从对数正态分布(Clementi and Gallegati,2005年),但人口中排名前1-3%的人可能除外。此外,由于多变量正态分布是厚尾分布,因此更可能产生极端实现。使用(15),解释变量来自正态分布,参数为x11,iiid~ N(1,1),x12,iiid~ N(3,1)和x21,iiid~ N(-2,1),x22,iiid~ N(4,1),x23,iiid~ N(-1, 1). (25)我们设置β=(1.0,-0.5,1.6)和β=(1.5,-1.2, -0.7, 2). 我们从多元正态分布N(0,∑)生成误差,其中∑=1 0.50.5 1. (26)在不损失一般性的情况下,我们假设方差相同,并将两个方程中的误差之间的相关性乘以0.5。我们为模拟实验设置了三个样本大小:100、250和500。当从多元t分布生成误差时,我们将位置参数设置为u=0,形状参数设置为∑。

15
mingdashike22 在职认证  发表于 2022-4-24 14:37:16
如前所述,鉴于以下因素的影响,控制多元正态分布混合模拟数据尾部行为的参数可能存在问题:正态分量的数量、协方差矩阵(我们将均值乘以零)以及分配给每个分量的权重。多元t分布就是df。我们将df设置为2、3和4。对于df=2,对应的多元t分布的尾部比具有相同位置和形状参数u和∑的多元正态分布的尾部重得多。当df为4时,多变量t分布的尾部仅略重于多变量正态分布。我们的dp调查应该证明在所有三种情况下都相对有效,因为多变量t分布比多变量正态分布有更大的尾部。考虑到尾部较轻,df中效率的提高将减少。多元对数正态情形中的误差首先从多元正态分布中提取,然后取这些提取的自然指数。由于对数正态分布具有正平均值,因此有必要对其进行降阶,使误差具有零平均值。我们的dp sur预计在对数正常情况下具有效率增益,因为它是不对称和重尾的。3.4 DP-SUR模拟结果下面我们给出了模拟结果。我们给出了使用我们的dp sur方法和假设多变量正态误差的贝叶斯sur估计的后验标准差(s.d.),以及它们之间的差异百分比。由于所有参数的后验概率行为一致相似,为了清晰起见,我们仅给出关于β和β的结果。多变量t分布误差稳定1表示后s.d.s和s.d.s之间的百分比差异。

16
何人来此 在职认证  发表于 2022-4-24 14:37:22
用dp sur和normal sur进行估计,两者都是样本的平均值。我们观察到,当df为2、3和4时,THDP sur产生较小的后部s.d。df为2时的百分比差异大于40%,df为3时的百分比差异大于20%,df为4时的百分比差异约为15%,如表的上三个面板所示。效率增益随着样本量的增加而增加,因为实现了更多的误差极值。参数sur假设所有实现都有相同的∑,其中极端的将扩展所有实现共享的∑。相比之下,这些极值化将由dp sur分配给具有较大∑i’s的分布,而其余的将被视为具有较小∑i’s的正态分布的实现。通过调节误差分布中更高程度的异质性,dp sur可能实现更高的效率增益。我们的结果与预期一致。当df为2(尾部最重)时,半参数DP sur的效率增益最大。考虑到误差分布的尾部不太重,效率增益会随着DF的增加而下降。事实上,在表2中,df是确定的,我们观察到用这两种方法估计的后s.d.非常接近。dp sur的s.d.略大于其sur对应物。这并不奇怪,因为当误差的分布是多元正态分布时,参数化方法更省钱,使用误差协方差矩阵的正确结构。在多变量正态情况下,在三个样本量中,当样本量为100时,s.d.之间的差异最大。

17
nandehutu2022 在职认证  发表于 2022-4-24 14:37:27
这是预期的,因为我们不使用df 1,因为在这种情况下,t分布甚至没有平均值。我们对每个样本量进行了100次模拟,结果证明,即使样本量最小,也能获得稳定的结果。包含后验平均数的表格可在附录中找到。对于后验均值表,有6列显示了这两种方法对3种相关性估计的均值。完整结果见附录。% = (南沙群岛)- s、 d.dp)/s.d.sur×100%。尽管如此,差异仍然很小,所有系数都不到2.5%。在这种情况下,当样本规模较小时,不那么节俭的dp sur对效率的影响较大。表1:后s.d.,多变量t错误SDF=2样本大小100 250 500参数DP SUR% 南大鹏酒店% 南大鹏酒店%β0.1149 0.2155 41.57%0.0732 0.1596 49.56%0.0458 0.1126 54.22%0.1107 0.2080 41.49%0.0649 0.1359 48.48%0.0508 0.1198 52.78%df=3样本大小100 250 500 DP SUR% 南大鹏酒店% 南大鹏酒店%β0.1114 0.1452 21.20%0.0708 0.0973 26.05%0.0446 0.0634 28.53%0.1079 0.1397 20.63%0.0630 0.0866 25.91%0.0488 0.0694 28.70%df=4样本量100 250 500dp SUR% 南大鹏酒店% 南大鹏酒店%β0.1079 0.1248 13.52%0.0696 0.0826 15.22%0.0440 0.0529 16.58%0.1054 0.1200 12.15%0.0618 0.0733 15.08%0.0473 0.0582 18.41%df=∞样本量100 250 500 DP SUR% 南大鹏酒店% 南大鹏酒店%β0.0854 0.0837-2.09%0.0569 0.0565-0.85%0.0372 0.0371-0.56%0.0879 0.0860-2.25%0.0575 0.0572-0.58%0.0388 0.0384-1.14%多变量对数正态误差后s.d.s如表2所示。我们观察到,在假设i.i.d.正态误差的情况下,后s.d.的dp sur比使用贝叶斯sur计算的dp sur小55%以上。效率增益随着样本量的增加而增加,在500次观察的情况下达到65%以上。

18
何人来此 在职认证  发表于 2022-4-24 14:37:33
与t分布错误的情况一样,这是因为在更大的样本中存在更极端的错误实现,通过对它们进行分组,可以提高效率。表2:后验s.d.,多变量对数正态误差SLOG正态样本量100 250 500参数DP SUR% 南大鹏酒店% 南大鹏酒店%β0.0720 0.1831 57.64%0.0415 0.1266 65.06%0.0272 0.0834 66.61%β0.0800 0.2119 58.78%0.0439 0.1277 64.38%0.0270 0.0826 66.39%3.5 DP-SUR经验示例下面我们将我们的DP-SUR方法应用于一个生产要素需求的经济模型,该模型带有一个广义Leontief成本函数(Diewert,1971),这是一个方程组,方程组的数量与要素数量相同。为了使我们的经验证明尽可能具有普遍性,我们不施加对称性或同质性限制。该数据集取自Malikov等人(2016年),包含2001年至2010年间对285家美国大型银行的2397次观察。数据包括投入的数量和价格,即劳动力、实物资产和借入资金,以及产出的数量,即abank提供的贷款。鉴于相对较大的样本量,我们有可能在不同样本量下探索dp sur的性能。因子需求方程组可以写成asaL=LY=βLL+βLAPAPL+βLFPFPL+βLTT+εL(27)aA=AY=βaA+βALPLPA+βAFPFPA+βATT+εA(28)aF=FY=βF+βF LPLPF+βF APAPF+βF TT+εF(29),其中L、A和F分别表示劳动力、实物资产和借款的数量;T表示趋势变量;Y表示产量,pki表示系数k的价格,带k∈ {L,A,F}。对于我们假设的误差(εLi,εAi,εfi)~ N(0,∑i),其中,∑i是观测i的协方差矩阵。我们允许误差在系统中的三个方程之间关联,即。

19
能者818 在职认证  发表于 2022-4-24 14:37:38
cov(εki,εsi)6=0,带k,s∈ {L,A,F}索引方程。鉴于主要关注对象是价格弹性,我们报告了三个因素价格弹性的后验概率和标准差。利用广义Leontief成本函数,各因素的交叉价格弹性由eks=βks(Pk/Ps)给出-1/2ak,k6=s,(30)自身价格弹性为ekk=-Ps6=kβks(Pk/Ps)-1/2ak。(31)表3包含要素需求价格弹性的后验平均值。我们可以看到,在800观察子样本和完整样本中,所有弹性的后验均值都相对较小,这表明美国银行对要素(劳动力、实物资产和借款)的需求相对缺乏价格弹性。请注意,在两个样本中,劳动力和实物资产的自身价格弹性均为负值。相比之下,借入资金的自身价格弹性为正,尽管我们注意到,与劳动力和实物资产相比,绝对价值非常小。这表明,在美国银行业的生产过程中,借贷资金的需求缺乏弹性。一个潜在的原因是,借来的资金通常用于满足美联储规定的存款准备金率。这样的特点使得借入资金相对于价格具有弹性。用dp sur估计的后验均值与假设正态误差的贝叶斯sur估计的后验均值之间存在一些差异。在模拟研究中没有观察到这种差异。然而,应该注意的是,在模拟中,回归方程得到了正确的描述,但经验数据不能保证这一点。在具有经验数据集的后验者中,这种差异也在具有DP先验的半参数混合物的文献中观察到,包括Conley等人。

20
nandehutu2022 在职认证  发表于 2022-4-24 14:37:44
(2008).请注意,当系统中的所有方程共享相同的解释变量时,sur和ols估计量完全相同。如表4所示,对于这种弹性,后部s.d.也相对较大。表3:弹性,美国银行业:后验平均数800观察子样本投入劳动力资产资金参数DP SUR DP SUR DP SUR DP SUR DP SUR DP SUR工资-0.189-0.422 0.375 0.254-0.016-0.007资产价格-0.009 0.131-0.690-0.585 0.012 0.002资金价格0.198 0.291 0.315 0.331 0.004 0.004完整样本,2397观测输入劳动力资产资金参数DP SUR DP SUR DP SUR DP SUR DP SUR DP SUR DP SUR DP SUR工资-0.149-0.201 0.406 0.385 0.004-0.001资产价格-0.094-0.068-0.686-0.668-0.016-0.005资金价格0.243 0.270 0.280 0.283 0.012 0.006表4给出了用两个样本估计的价格弹性的后标准差。我们观察到,对于所有价格弹性,dp sur比假设正态的贝叶斯sur获得更小的后验s.d。这并不意外,因为弹性是方程系统中回归参数的函数,半参数dp-sur比参数贝叶斯sur的后验s.d.更小。最大百分比差异(%) 在800个观察子样本中,劳动力需求相对于实物资产价格的交叉价格弹性发生,其中dp Suprosterior s.d比sur对应值小38.27%。在完整样本中,借款资金需求相对于实物资产价格的交叉价格弹性差异最大,达到39.15%。表4:弹性,美国。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-31 02:26