楼主: 大多数88
1186 23

[量化金融] 高维协方差的稀疏近似因子估计 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-24 04:29:14
然而,应注意的是,只有当∧∧∧∧上的l-范数惩罚进入惩罚优化问题(6),即u>0时,SAF模型的识别才成立。对于u=0,我们处于AFM的标准r d ML设置中,仅在这种情况下,我们在Lawley和Maxwell之后确定了模型。章节中给出了一个简短的fa ct演示,即PPP只能是L范数的一个统一的线性置换矩阵。1.4附录以及Horn and Johnson(2012)中的内容。(1971),通过采用∧∧∧∧′ΦΦ的识别限制-1u∧∧∧∧∧是对角线,以降序排列的距离对角线。与下文中引入的弱fa-cto-r假设相反,传统上针对标准近似因子模型(如Bai和Ng(2002),Stock和Watson(2002))进行的渗透性消耗意味着∧∧∧∧′∧∧∧的r最大特征值以O(N)的速率发散。直觉上,这意味着所有因素都很强,整个时间序列都会受到影响。因此,下文Sumption2.1中引入的因子荷载矩阵的稀疏性大大放松了传统的普遍性假设。假设2.1(因素的弱点)。存在一个常数c>0,这样,对于所有N,c-1<πmin∧∧∧′∧∧∧∧Nβ!≤ πmax∧∧∧′∧∧∧∧Nβ!<c、 其中1/2≤ β ≤ 1.假设2.1意味着∧∧∧∧′∧∧∧∧的r最大特征值与Nβ, 这可能比标准AFM慢得多。此外,参数β可以为∧∧∧∧∧′∧∧∧∧的每个特征值取不同的值。因此,特征值以不同的速率变化。另一方面,β=1的特殊情况意味着标准AFM框架具有强大的因素(即Fan、Liao和Mincheva(2013)、Bai和Liao(2016))。因此,我们的稀疏近似因子模型为标准因子模型提供了方便的推广。

12
大多数88 在职认证  发表于 2022-6-24 04:29:17
此外,假设2.1对∧∧∧的稀疏性有直接影响。事实上,这可以通过根据以下表达式上推∧∧∧∧的谱范数得出:k∧∧∧∧∧k≤√N k∧∧∧∧k=ON(1+β)/2和k∧∧∧∧k≥ k∧∧∧∧k=ONβ/2. (7) c需要β的1/2下限来持续评估因子。参见引理。1.7节。补充文件中的1.1。这一结果表明,施加弱因子假设限制了所有f因素中受影响的时间序列的数量,因此要求因子载荷矩阵的每列中有不可忽略的零元素数量。然而,随着β的增加,零f因子加载的数量可以任意小。注意,等式(7)的下界限制了∧∧∧∧每列中零元素的数量,因此我们可以将公共成分与特殊成分分离开来。标准AFM施加的普遍性假设进一步意味着将数据协方差矩阵的特征值明确划分为两组,对应于公共分量的发散特征值和特殊误差协方差矩阵的有界特征值。这些特征可以在图1中观察到,其中两个面板都说明了数据集的特征值结构,仅基于T=450的强因子和不同的N.1 2 3 4 5 6 7 8 9 10(a)T=4501 2 3 4 5 6 7 8 9 10(b)T=450的强因子模拟数据的特征值图1:基于强因子的特征值结构面板仅在包含的因子数量上有所不同,其中,左面板包含一个强因子,右面板描述了四个强因子的情况。

13
何人来此 在职认证  发表于 2022-6-24 04:29:21
这两幅图都揭示了各自特征值结构中的一个明确部分,即特征值集与样本量N(对应于包含的强f因子的数量)和与特质成分相关的有界特征值集。图2:T=4501的标准普尔500指数股票成分的股票收益率特征值图3:T=450的1个强因子和3个弱因子模拟数据的特征值然而,在实际数据集中通常找不到协方差矩阵的特征值结构中如此清晰的分离。一个示例提供了一个数据集,该数据集包含标准普尔500指数在整个450个月期间的月度资产收益率成分,其特征值分布如图2所示。该图显示了第一个特征值和剩余特征值之间的明显区别。然而,剩余的特征值以较慢的速度发散,标准原子力显微镜所暗示的共同成分和特殊成分之间的明显分离是不可能的。因此,允许公共组件特征值中的较慢发散率的弱因子框架对于真实数据集的特征值结构建模更为现实。此外,弱因素假设支持有充分证明的经验数据。同样的数据集也用于我们的经验应用中,并在第5节中进行了更详细的描述。资产回报率样本协方差矩阵的特征值以不同的速率发散的证据(参见Ross(1976)和Trzcinka(1986))。图3描述了数据集的特征结构,它由一个强因子和三个弱因子生成。

14
mingdashike22 在职认证  发表于 2022-6-24 04:29:24
这个带有弱因子的模型很好地模拟了我们观察到的标准普尔500指数资产回报率的衰减特征值结构。2.3特殊误差协方差矩阵∑∑∑uIn的估计为了放松对∑∑∑uIn施加的正交性假设,在我们估计的第一步,我们通过Fan、L iao和Mincheva(2013)的主正交互补阈值(POET)估计量重新估计特殊误差项的协方差矩阵。POET估计器基于对从近似fa cto r模型估计得到的残差样本协方差矩阵的反对角线元素进行软阈值化。因此,它在特质协方差矩阵中引入了稀疏性,并为使用样本协方差估计器生成的不可逆性问题提供了解决方案,尤其是在高维环境中,其中N接近或甚至大于T。更具体地说,基于POET方法的估计特殊误差协方差矩阵∑∑∑∑∑τu定义为∑∑∑∑τu=^∑τijN×N,^στij=σu,ii,i=jS(σu,ij,τ),i 6=j其中σu,ij是样本协方差矩阵的第ij个元素ssu=TPTt=1(xxxt-^∧∧∧∧∧ffft)(xxxt-估计因子模型残差τ的∧∧∧∧∧∧∧∧∧∧ffft=√N+qlog(N)是一个阈值,S(·)表示软阈值算子,定义为:S(σu,ij,τ)=符号(σu,ij)(|σu,ij |- τ)+. (8) 与toFan、Liao和Mincheva(2013)使用基于PCA估计器的静态因子模型的残差相比,我们的估计是基于稀疏因子模型的残差。因此,我们遵循Fan、Liao和Mincheva(20 13)的方法,使用两步程序,在第一步中,我们确定了共同部分,但与PCA框架不同,我们考虑了薄弱因素;第二步,我们对特质成分的一般方差结构进行建模。

15
kedemingshi 在职认证  发表于 2022-6-24 04:29:27
通过使用两步程序,我们分别控制∧∧∧∧和∑∑∑中的稀疏模式,从而确保加载矩阵中的稀疏性不会被特殊误差协方差矩阵中的稀疏性扭曲。此外,使用嵌入lnorms的两个高维矩阵的联合估计将带来计算负担,并导致相当大的数值稳定性。通过将联合估计分离到我们的两步程序中,我们获得了一种计算时间高效的数值稳定优化方法。2.4 SAF协方差矩阵估计基于近似e因子模型的数据协方差矩阵估计值根据∑∑=Cov[XXX]=∧∧∧∑∑∑∑∑∧∧∧∑∑∑F∧∧∧∧′+∑∑u得出。因此,我们首先根据第2.2节中介绍的稀疏因子模型估计因子FFF和因子载荷∧∧∧。由(4)和(5)分别给出的MLE和GLS得到的∧∧∧和ffftare的一致估计。这产生了共同和特殊成分的估计。阈值τ基于引理S.1.10中规定的特殊误差协方差估计的收敛速度。附录S.1.2节。(1)中定义的AFM。后者被用作第2.3节中介绍的诗人估算∑∑Ub的输入。因此,我们的SAF协方差矩阵估值器由以下参数给出:^∑∑∑∑SAF=^∧∧∧∧∧SSS∧∧∧∧F∧∧∧∧′+^∑∑∑∑τu,(9)其中SSS∑∑F表示估计因子协方差矩阵的样本估值器,这是正定义,因为观测值的数量超过因子的数量。此外,根据toBickel和Levina(2008a),使用阈值τ的特殊误差协方差矩阵的收敛速度也可以保证∑∑∑τ为正定义,概率趋向于t。

16
可人4 在职认证  发表于 2022-6-24 04:29:30
因此,协方差矩阵估计量∑∑∑∑通过构造得到正定义。附录S.2节描述了实施问题、系数数量的选择和调谐参数u的选择。3大样本性质为了建立因子载荷矩阵∧∧∧和数据协方差矩阵∑∑∑估计量的一致性,我们采用以下标准假设:假设3.1(数据生成过程)。(i) {uut,ffft}t≥1完全静止。E【uit】=E【uitfkt】=0,我≤ N、 k级≤ r和t≤ T(ii)存在r,r>0和b,b>0,因此对于任何s>0,i≤ N和k≤ r、 P|uit |>s≤ 经验值(-(s/b)r),P|fkt |>s≤ 经验值(-(s/b)r)。(iii)确定混合系数:α(T):=supA∈F-∞,B∈F∞TP(A)P(B)- P(AB), 其中f-∞和F∞Tdenote{(ffft,uut)生成的σ-代数:-∞ ≤ t型≤ 0}和{(ffft,UUT):T≤ t型≤ ∞}.强迁移:存在r>0和C>0 s.t.:α(t)≤ 经验值(-CTr),T∈ Z+。(iv)存在常数c,c>0,使得c≤ πmin(∑∑∑u0)≤ πmax(∑∑∑u0)≤ c、 3.1中的假设对数据生成过程施加了规律性条件,与Bai和Liao(2016)施加的条件相同。条件(i)规定了UUUTA和FFFTA的严格统计性,并要求这两个术语不相关。条件(ii)要求单一类型的故障,允许使用rTPTt=1 ITUJT的大偏差理论-σu,ijandTPTt=1fjtuit。为了允许弱序列依赖,我们施加条件(iii)中规定的强混合条件。

17
何人来此 在职认证  发表于 2022-6-24 04:29:33
此外,条件(iv)意味着特殊误差协方差矩阵的有界特征值,这是因子模型框架中常见的识别假设。假设3.2(稀疏性)。(i) LN=Prk=1PNi=11l{λik6=0}=O(N),(ii)SN=maxi≤NPNj=11lσu,ij6=0, SNdT=o(1)和SNu=o(1),其中1l{·}定义了一个等于1的指示函数,如果布尔参数inbraces为真,dT=log NβN+Nβlog N,u表示正则化参数。假设3.2对∧∧∧∧和∑∑∑u施加稀疏条件,其中条件(i)定义了反映因子载荷矩阵∧∧∧中无n-0元素数量的数量ln。由于因子r的数量被假定为固定的,(i)限制∧∧∧∧每列中非零元素的数量为N的上界。同时,这对非零元素少于N的稀疏fa cto r荷载矩阵进行了假设。根据Bickel和Levina(2008a)的定义,条件(ii)规定量化∑∑u每行中非零元素的最大数量。此外,它还限制了∑u的每一行中零元素的数量。

18
kedemingshi 在职认证  发表于 2022-6-24 04:29:36
因此,它要求∑uis不太密集。3.1稀疏近似因子模型估值器的一致性定理3.1(稀疏近似因子模型估值器的一致性)。在假设s2.1、3.1和3.2下,(6)中的稀疏因子模型满足以下性质,如T和N→ ∞ 和1/2≤ β ≤ 1: N个^ΛΛΛ -ΛΛΛF=Opu+log NβN+Nβlog NT!,N^ΦΦu-ΦΦu0F=Oplog NβN+log NT!。因此,对于log(N)=o(T)和正则化参数u=o(1),我们得到:N^ΛΛΛ -ΛΛΛF=op(1),N^ΦΦu-ΦΦu0F=op(1)和^ffft-ffft公司= op(1),t型≤ T、 对于第二步中特殊误差的协方差矩阵估计,具体见第2.3节,我们得到:^∑∑∑τu-∑∑∑u= OpSNru+NLNdT!,fo r dT=对数NβN+Nβlog NT。因此,对于SNdT=o(1)和SNu=o(1),这将产生:^∑∑∑τu-∑∑∑u= op(1)。附录S.1.1和S.1.2节给出了定理3.1的证明。在给定的正则条件下,该定理建立了基于稀疏因子模型的因子载荷矩阵和特质误差协方差矩阵估计量的Frobenius范数的平均相合性。更具体地说,∧∧∧∧和ΦΦΦ可以得到一致的估计,而无需在我们的估计过程的第一步对∑∑u进行对角性限制。因此,基于GLS估计的FFFT因子也很一致。β的1/2下限是实现一致性的必要条件。从直觉上看,这意味着这些因素不应该太弱,以至于在常见和特殊成分之间仍然存在明显的区别。此外,∑∑∑uca的第二步估计量可以在谱范数下一致估计。3.2协方差矩阵估值器的一致性最后,在本节中,我们将仔细研究SAF协方差矩阵估值器的渐近性质,见第2.4节。

19
能者818 在职认证  发表于 2022-6-24 04:29:39
以下定理证明了协方差矩阵估计量及其逆在不同矩阵范数下的收敛性。定理3.2(协方差矩阵估计的收敛速度)。在假设2.1、3.1和3.2下,基于方程式(9)中SAFmodel的协方差矩阵e估计满足以下性质,如T、N→ ∞ 和1/2≤ β ≤ 1: N个^∑∑∑SAF-ΣΣΣ∑∑=Opu+dT+“NβN+SNN#u+dT, (10) N个^∑∑∑SAF-ΣΣΣF=OpNu+dT+hNβ+SNiu+dT, (11)N^ΣΣΣ-1SAF-ΣΣΣ-1.F=OpNβ+SNu+dT!, (12) 式中,dT=log NβN+Nβlog N和kAAAk∑∑∑=√NΣΣΣ-1/2AAA∑∑∑-1/2Fdenotes Fan、Fan和Lv(20 08)引入的加权二次范数。附录S.1.3节给出了定理3.2的证明。与forTheorem 3.1类似,我们假设正则izat离子参数u=o(1),log(N)=o(T)。定理3.2中的方程(10)表明,如果我们考虑β的整个可能值集的加权二次范数,则基于方程(9)中解析因子模型的协方差矩阵估计量是一致的。通常,由于公共分量的特征值发散过快,很难在平均Frobenius范数下收敛(见Fan、Liao和Mincheva(2013))。然而,根据方程式(11),如果u=o,我们的SAF协方差矩阵估值器是一致的N-β/2和1/2≤ β / 9/10. 因此,标准d近似因子模型中的渗透性消耗的松弛考虑到弱因子,导致协方差估计在平均Frobenius范数下收敛。

20
mingdashike22 在职认证  发表于 2022-6-24 04:29:42
β的上界遵循定理3.2的表达式Nβlog NβNin方程(11)。此外,定理3.2的方程式(12)表明∑∑∑SAFis的逆在平均Frobenius范数下一致估计。4蒙特卡罗证据在下文中,我们给出了新协方差估计量的有限样本性质的蒙特卡罗证据。特别是,我们关注协方差矩阵估计值的准确性,这取决于维数以及待估计的真协方差矩阵中相关性的强度。将SAF估计器的仿真结果与文献中流行的八种竞争估计器的仿真结果进行了比较。4.1蒙特卡罗设计对于我们的蒙特卡罗实验,我们使用三种不同的真协方差矩阵设计∑∑。在第一种情况下,我们认为在β上界的闭式解中使用一致协方差矩阵设计是不可行的,因此我们在数值上近似于β的最大值,使得表达式Nβlog NβN趋近于零。Abadir、Distaso和71zikeˇs(2 014),其形式如下:σuii=1和σuij=ηU(0,1),对于i 6=j,(13),其中U(0,1)表示标准的均匀随机变量,我们设置η∈ {0.025, 0.05 , 0 .075}.在该设置中,η控制变量之间的相关性,其中η的增加放大了协变量之间依赖性的强度。对于第二个设计,我们使用Bien和Tibshirani(2011)提出的稀疏协方差矩阵,其中包含具有一定概率的o-对角线的零条目。更具体地说,协方差矩阵σij=σji的第ij个元素被指定为概率为p的非零元素,其中p∈ {0.05, 0.075, 0.1 }. 与均匀设计中类似,对角线元素设置为1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 05:11