楼主: 能者818
1872 71

[经济学] 具有交互作用的异质面板数据的二进制响应模型 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-4-26 11:52:51
在附录A.3中,我们进一步讨论了如何处理偏见。当{εit}是i.i.d.除以i和t时,我们可以估计∑byb∑=NTNXi=1TXt=1git(bzit)b∑(dβ)u,iuitu0′itb∑(dβ)′u,i。在(2.15)中进行的讨论仍然适用于这里。接下来,我们将提供一个选择因子数量的信息标准,并给出一个数值实现过程。2.3因子数量的选择在与引理2.1的联系中,我们定义了以下信息标准:IC(d)=NTNXi=1TXt=1耶- Gε(bzdit)+ d·ξNT√NT,(2.19),其中bzdit是通过(2.8)通过将因子的数量设置为d,ξNT获得的→ ∞, 和ξNT√新界→ 我们通过最小化(2.19):bd=argmin0来估计DF≤D≤dmax(d),(2.20),其中dmax(≥ df)是用户指定的大固定常数。一般来说,标准的形式如下。估计误差的测量+惩罚项(2.21)已被广泛的选择程序采用,例如传统的/BIC、L ASSO(Huang et al.,2008)和事实r分析(Bai和Ng,2002)。逻辑是,当选择不足时,就会产生偏见或矛盾的结果。因此,(2.21)中的估计误差测量将非常大。当发生过度选择时,估计误差将无条件地与正确选择的情况相同。然而,由于过度选择造成的效率损失,惩罚项开始发挥作用,并将产生比估计误差大得多的收敛速度。这就是为什么ξNt需要满足(2.19)中规定的某些条件。在文献中,对于ξNT提出了各种各样的对数形式。ξn是否为最佳形式尚不清楚,但√在下面的模拟中,N+T适用于不同的数据生成过程。

22
何人来此 在职认证  发表于 2022-4-26 11:52:57
Bai和Ng(2002)的g(N,t)也进行了类似的讨论。最后但并非最不重要的一点是,对于估计误差的测量方法的选择,两种被广泛采用的形式是似然型表示(Chu等人,2011年的公式(2.9))或均方误差(Huang等人,2008年的公式(6))。鉴于引理2.1的发展,这两种形式在我们的例子中几乎是等价的。为了简单起见,我们采用了后者,并在下一个定理中总结了渐近性。定理2.3。在假设1和2下,进一步假设ξNT→ ∞ 和ξNT√新界→ 0.As(N,T)→ (∞, ∞), Pr(bd=df)→ 1.值得一提的是,定理2.3只需要任何有限条件,即假设1和假设2。对于因子数量的每个给定值,我们可以执行第2.1节的估计程序,然后计算信息标准(2.19)来选择因子数量。3模拟在本节中,我们进行模拟以检查第2节的理论发现,并具体考虑以下数据生成过程。耶=1,x′itβ0i+γ′0if0t- ε它≥ 00,否则。由f0t,j重新生成的系数和载荷a~ U(-2.5,2.5)和γ0i,j~ U(0,6),其中γ0i,jand f0t,jstand分别表示γ0i和f0t的j分量,j=1,df。为了引入回归系数和因子结构之间的相关性,我们假设xit,j=N(0,1)+0.5(|γ0i,1 |+| f0t,1 |),其中xit,js代表xit的j辅助,j=1,dβ。对于系数,设β0i,j=i/N,其中i=1,N、 j=1,dβ和β0i,j代表β0i的增强。

23
mingdashike22 在职认证  发表于 2022-4-26 11:53:04
我们考虑误差项的两种分布,对于每种分布,我们改变误差项的时间序列相关性和横截面相关性,以检验所提出方法的敏感性。案例1——轻尾分布GP 1:εit~ N(0,1),其中N(0,1)是标准正态分布。DGP 2:设εt=ρε·εt-1+1/2ν·νt,其中ρε=0.3,∑ν={0.3 | i-j |}N×N,εt=(ε1t,…,εNt)′,和νt=(ν1t,…,νNt)′,每一个νit都是N(0,1)的独立图。DGP 3:让DGP 2的ρε为0.7,其余设置与DGP 2的t软管相同。案例2——重尾分布我们仍然像案例1一样考虑三个DGP,但用逻辑分布替换所有正态分布。对于每个生成的数据集,我们首先使用(2.19)中定义的信息标准选择因素的数量,然后进行估计。我们重复上述程序多次,并报告以下数值以评估最终样本的性能:Pc=MMXj=1I(bdj=df)、Pu=MMXj=1I(bdj<df)、Po=MMXj=1I(bdj>df)、RMSEB=vuutMMXj=1NkbBj- Bk,RMSEF=vuutMMXj=1kPbFj- PFk,Stdβ(l)=NNXi=1vuutMMXj=1(bβ(l)i、 j- β(l)0i),(3.1)式中,bdj,bbjandbfjs分别代表估计的因子数、B=(β,…,β0N)′的估计值和F=(F,…,F0T)′的估计值;和β(l)0iandbβ(l)i、 jstand for the the thelβ0的值及其在第j次应用时的估计值。我们对这些措施发表评论。Pc、Pu和POMER分别测量正确、不足和过度选择因素数量的概率。如第2节所述,BFJ产生了一个旋转矩阵对Fup的一致性估计,因此我们测量了PBFJAN和PFin(3.1)之间的距离。不是从整体上看,而是从整体上看(l)检查评估程序的稳定性。

24
大多数88 在职认证  发表于 2022-4-26 11:53:10
具体而言,数量qmpmj=1(bβ(l)i、 j- β(l)0i)提供与β估计值相关的标准偏差(l)0i。当我从1运行到N时,我们进一步取i的平均值。我们让dβ=2,df=2,N,T∈ {50,100,150},M=500。此外,设ξNTof(2.19)为对数√在整个数值研究过程中,N+T没有失去一般性。下面的表1和表2总结了结果。首先,我们指出,无论误差项εit的尾部行为如何,新提出的方法都能很好地工作,因为由于计算能力的限制,我们不再探索更大的M值。实际上,更重的尾部需要更长的计算时间,这是意料之中的。与DGPs 1-3相关的数据在两个表中大致相同。第二,在表1中,随着样本量的增加,PCGO的值最高可达1。DGPs 1-3的模式相同。值得注意的是,当样本量相对较小时,信息标准往往会低估因子的数量,这对表2中所示的RMSEF值有明显的影响。第三,在表2中,随着样本大小的增加,RMSEB、RMSEF和Stdβ(1)的值通常收敛到0,这是意料之中的。T=50的情况除外,其中Stdβ(1)的值随着N的增加而略微增加。

25
能者818 在职认证  发表于 2022-4-26 11:53:17
同样,DGPs 1-3的模式相同。第四,与Logit模型相比,Probit模型倾向于产生较小的Std值(l)β、 这是因为Probit模型有薄薄的尾巴。表1:正确、不足和过度识别因素数量的百分比。10.6 0.0 0 0.0 0 0.0 0 0.7 0.0 0.0 0.0.0 0.0 0.0 0.0 0.0 0.0 0.0.0 0.0 0 0.0 0.0 0 0.0 0.0 0 0.0 0.0 0.0.0 0.0 0.0 0.0 0.0 0.0.0.0 0 0 0.0.0 0 0 0.0 0 0.0 0.0.0 0 0.0 0 0 0 0.0 0 0 0.0 0 0 0 0 0.0 0 0 0 0.0 0 0 0 0 0 0.0 0 0 0 0 0.0 0 0 0 0 0 0.0 0 0 0 0 0 0.0 0 0 0 0 0 0 0 0 0 0 0.0 0 0 0 0 0 0 0 0 0 0 0 0.0 0 0 0 0 0 0 0 0 0 0 0 0.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.8220.9881.000 0.174 0.006 0.000 0.004 0.0060 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.000 0.000 0.000 0.000DGP 250 0.228 0.772 0.946 0.7720.228 0.054 0.000 0.000 0.000100 0.734 1.000 1.000 0.266 0.000 0.000 0.000 0.000 0.000150 0.904 1.000 1.000 0.000 0.096 0.000 0.000 0.000 0.000 0.000 0.000 DGP 350 0.138 0.510 0.808 0.862 0.490 0.192 0.000 0.000 0.000 0.000 0.00000 0.00000 0.00000 0.00000 0.486 0.930.998 0.514 0.070.002 0.000 0.000 0.000 0.000 0.0000.000本节为0.000.0004.0004.000,我们利用标准普尔500指数股票的日收益率数据,将该模型和方法应用于对账单的分析。在经济学和金融学科中,投资组合分析和管理都得到了大量的研究。

26
mingdashike22 在职认证  发表于 2022-4-26 11:53:23
其中,一个基本问题是在构建投资组合时选择与每只股票相关的最优权重。从数学上讲,它是通过下一个最小化问题实现的。minww′∑pw服从w′N=1,(4.1),其中1Nis是一个N×1的向量,∑pis是一个正的定义矩阵,通常由股票收益数据决定,w包括分配给每只股票的weig hts。上述最小化问题的分析解决方案是可行的2:估算程序的不同测量MSEBRMESFSTDβ(1)Stdβ(2)N\\T 50 100 50 100 150 100 150 50 100 150 100 150概率D GP 1 50 0.6456 0。5751 0.5327 1.0214 0.8483 0.7862 0.2896 0.2409 0.2140 0.2883 0.2397 0.2145100 0.6394 0.5605 0.5174 0.8814 0. 7249 0.6838 0.2936 0.2387 0.2073 0.2935 0.2373 0.2081150 0.6365 0.5569 0.5159 0.8087 0. 6771 0.6560 0.2947 0.2341 0.2073 0.2952 0.2335 0.2058DGP 250 0.6401 0.5640 0.5147 1.0135 0.8345 0.7709 0.2966 0.2429 0.2154 0.2942 0.2453 0.2173100.6304 0.5458 0.5018 0.8649 0。7050 0.6722 0.3004 0.2417 0.2089 0.3025 0.2433 0.2102150 0.6281 0.5397 0.4983 0.7742 0. 6595 0.6372 0.3012 0.2382 0.2064 0.3021 0.2397 0.2064DGP 350 0.6499 0.5775 0.5286 1.0247 0.8502 0.7649 0.2885 0.2317 0.2025 0.2886 0.2332 0.2038100.6402 0.5573 0.5128 0.8769 0。6764 0.6345 0.2916 0.2309 0.1980 0.2939 0.2332 0.1965150 0.6360 0.5526 0.5104 0.7641 0. 6211 0.5929 0.2957 0.2280.1931 0.2958 0.2281 0.1933罗吉特DGP 150 0.6476 0.5490 0.4952 1.0282 0.8848 0.8233 0.4452 0.3869 0.3436 0.4470 0.3851 0.3427100 0.6447 0.5335 0.4686 0.8547 0。6963 0.6700 0.4519 0.3730 0.3257 0.4521 0.3729 0.3259150 0.6404 0.5272 0.4559 0.7695 0. 6162 0.5975 0.4495 0.3680 0.3174 0.4493 0.3667 0.3173DGP 250 0.6405 0.5420 0.4858 1.0158 0.8501 0.7861 0.4250.3809 0.3330.4209 0.3807 0.3368100 0.6394 0.5262 0.4608 0.7916 0。6517 0.6319 0.4499 0.3696 0.3143 0.4481 0.3686 0.3156150 0.6382 0.5203 0.4484 0.6624 0.

27
何人来此 在职认证  发表于 2022-4-26 11:53:31
5805 0.5570 0.4476 0.3602 0.3145 0.4472 0.3621 0.3149DGP 350 0.6453 0.5474 0.4823 1.0384 0.9278 0.8310 0.4232 0.3659 0.3280 0.4234 0.3674 0.3281100 0.6476 0.5327 0.4581 0.8854 0。6752 0.5989 0.4389 0.3661 0.3110 0.4387 0.3660 0.3078150 0.6503 0.5254 0.4547 0.7222 0. 5463 0.5181 0.4491 0.3590 0.3016 0.4499 0.3596 0.3006w=∑-1pN′N∑-1pN。(4.2)通常情况下,采用所有股票来构造∑p(例如,Chen等人,2019;Engle等人,2019),这自然属于高维矩阵估计的范畴。因此,为了提高估计精度,我们看到使用秩减少(Pelger and Xiong,2021)、惩罚(Chen et al.,2019)或两者(Fan et al.,2013)的方法越来越流行。默认情况下,上述技术在实践中适用于所有股票,尽管其中一些可能与其他股票相比具有相对较小的weig hts。正如Risto Offersen和Diebold(2006)以及Nyberg(2011)指出的那样,股票市场回报的迹象可能是可预测的,即使回报本身是不可预测的。此外,Christo Offersen和Diebold(2006)提到,“随着波动性的变化,正回报的概率也会随之变化:波动性越高,正回报的概率越低”。鉴于投资组合分析的主要目标是将波动性降至最低(Engle et al.,2019),一个具有交互固定效应的二元响应面板数据模型通过建模正收益的概率,自然地与上述研究相结合,因此我们可以放弃那些低概率的研究。4.1数据股票价格数据收集自https://www.kaggle.com2008年1月2日至2018年12月31日期间。剔除在整个时间段内没有股票回报的公司后,我们最终得到319只股票(N=319)。

28
能者818 在职认证  发表于 2022-4-26 11:53:37
我们采用对数标准化CBOE波动率指数(VIX)(http://www.cboe.com)作为回归者,它被广泛视为市场情绪的良好指标(例如Christo Offersen和Diebold,2006年;Pelger和Xio ng,2021年)。此外,我们还从美国收集了无风险利率(RFI)数据。美国财政部(https://www.treasury.gov)为了评估所提出方法的性能,在上构造Sharpe比率化器。4.2实证分析下面,我们进行了滚动窗口分析,重点是ecast的样本外。对于到达窗口,我们使用下一个模型,利用最近505个交易日(大约两年)的样本信息估计∑p。易,t+1=1,xitβ0i+γ′0if0t- ε它≥ 00,否则,其中1和0分别代表正回报和非正回报。我们总是将每个滚动窗口的第一个可用交易日计算为0,并使用t=0,5.03至5.03。xit包括第t天的VIX值,而yi,t+1是第t+1天股票i的符号。对于每个估计,我们首先选择因素的数量,然后进行估计。这将为我们提供以下数量:bβi\'s、bγi\'s和bftwith t=1,503.之后,我们在估计模型中引入xitat t=504的值,以预测t=505时股票正反转的概率。由于f0twith t=504仍然未知,我们将其替换为bftwith t=503作为近似值。原因是,尽管f0t可能会明显变化,但我们并不期望在任何特定时间点出现任何突然的跳跃。或者,为了预测未知因素的下一个时期,可以遵循伯南克等人(2005)的做法,实施更多的结构,例如VAR过程。通过这样做,我们无法在每一个想象中选择因素的数量。

29
mingdashike22 在职认证  发表于 2022-4-26 11:53:43
此外,在进行更全面的调查之前,应该考虑最佳滞后的数量,如Bernanke等人(2005年)所述。在这项研究中,为了不偏离我们的主要目标,我们将沿着这条路线进行实证研究。我们将估计正收益概率大于或等于0.5的股票构造∑pof(4.1),然后使用(4.2)计算权重向量w。如果所有估计的概率小于0.5,则记录w=0(即当天没有交易)。最后,我们计算t=505的收益加权平均值。我们从第一个可用窗口到最后重复上述预测过程,并考虑误差项的概率模型。对于误差项,使用其他分布(例如t分布和Logit模型)的结果非常相似,因此我们将重点讨论下面Probit模型的结果。Wefollow Engle et al.(2019)考虑在没有卖空约束的情况下估计全球最小方差组合的问题。作为比较,在预测风险迹象时,我们还考虑了仅具有固定影响的模型(下文称为FE)和Boneva和Linton(2017)的模型(下文称为BL)。此外,我们还考虑了两种利用整个库存的传统方法。具体而言,我们考虑的是equal weig hted投资组合(以下简称EW),这是一个标准基准,由DeMiguel等人(2007)等提出。此外,我们还使用了∑p的相关矩阵(以下称为CM),这在Engle等人(2019)中有提及。我们承认,在构建投资组合时,有许多其他方法可用,例如Fan等人(2013年)的惩罚方法、inChen等人(2019年)的非参数方法、Pelger和Xiong(2021年)、inEngle等人的动态协方差矩阵估计方法。

30
何人来此 在职认证  发表于 2022-4-26 11:53:50
(2019)等。在一项研究中用尽所有可能的方法是非常困难的,因为这可能会导致一篇全面的综述论文。因此,我们不再在本文中与这些方法进行比较。在下文中,我们报告(1)。整个有效期内加权回报率的平均值(平均值),年化后乘以252;(2). weig htedreturns在整个有效期内的标准偏差(Std),每年乘以√252; (3). 信息比率定义为平均值与标准差(IR)的比率;以及(4)定义为回报率平均值减去标准化风险收益率(SR)的利差率。年平均值和标准差与Engle等人(2019年)第6.2节中的定义一致。我们请感兴趣的读者参考他们的论文进行更多相关讨论。此外,由于一系列关于投资组合分析的文献对从具有预定数量因子的因子模型进行估计感兴趣(Pelger和Xiong,2021),我们报告了因子数量固定为1,5个。我们还报告了使用IC of(2.19)为每个估计选择最佳因子数的情况的结果。结果汇总在表3中。总的来说,我们正在寻找一种策略,该策略产生的Std值较小,但平均值、IR和SR值较大。CM方法产生的平均值最大,但也有最大的Std,由于高波动性造成的高风险,应该最不受欢迎。OFE模型产生的Std最小,这在某种意义上是可以预期的,因为模型简单。它还分别产生平均值、IR和SR的最小值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-12 07:31