楼主: 何人来此
1746 55

[量化金融] 高维估计、基础资产和自适应多因素 [推广有奖]

11
能者818 在职认证  发表于 2022-6-10 00:50:40
文献[29]中使用的稀疏主成分分析方法消除了传统主成分分析的许多缺点,甚至将风险因素解释为随机非熵风险因素。然而,所有这些方法仍然存在方差分解框架遗留的问题(可解释性低、预测精度低等)。我们在这里使用的替代方法是放弃方差分解方法,而是使用高维方法,例如原型聚类,选择基本集作为它们所代表的组的“原型”或“中心”。提出的IBS方法解释更清楚,预测精度更高。下文第6节给出了解决高维和强相关性困难的替代方法的详细比较。其他方法包括弹性网或岭回归来处理相关性。弹性网和RidgeRegression通过增加惩罚使相关矩阵可变来处理多重共线性。然而,这两种方法都没有考虑潜在的集群结构,这使得很难解释所选的基础资产。这就是第一步需要原型聚类的原因,因为它将选定的基础资产解释为它们所代表的集团的“原型”或“中心”。在原型聚类之后,我们使用LASSO的修改版本(用于GIBS算法),而不是弹性网或岭回归。

12
mingdashike22 在职认证  发表于 2022-6-10 00:50:43
原因是,与GIB相比,替代方法实现的预测优度要低得多(见表5),但选择了更多的基础资产(见图7),这会过度拟合模型,使模型不易解释。控制套索稀疏性的调整参数λ传统上是通过交叉验证来选择的,利用该λ,模型为每家公司选择平均13.4个基础资产。然而,如比较第6节所示,与样本外R的GIBS算法相比,这超出了数据中的噪声。下文第6节讨论了交叉验证性能不佳的原因。因此,为了防止过度配置,我们使用“1se规则”以及基准资产数量不得超过20的阈值。本文用GIBS算法估计的自适应多因子(AMF)模型与数据一致,优于Fama-French五因子模型。本文概述如下。第2节介绍了本文使用的高维统计方法,第3节介绍了要估计的自适应多因素(AMF)模型。第4节给出了所提出的GIBS算法来估计模型,第5节给出了实证结果。第6节讨论了我们选择我们的方法的原因,并提供了与其他方法的详细比较。第7节讨论了基础资产的风险溢价,第8节给出了一些示例。第9节结束。

13
何人来此 在职认证  发表于 2022-6-10 00:50:47
所有代码都是用R编写的,可以在Gi上找到thubhttps://github.com/pig618/amf_gibs.2高维统计方法由于高维统计在金融文献中相对较新,本节回顾了相关的统计方法。2.1预备知识和符号Let kvkq指定尺寸为p×1的向量v的标准lqnorm,即kvkq=(Pi | vi | q)1/qif 0<q<∞#{i:vi6=0},如果q=0maxi | vi |如果q=∞.假设β也是一个维数为p×1的向量,一个集合S {1,2,…,p},那么βSis是一个p×1向量,第i个元素(βS)i=(βi,如果i∈ S0,否则。这里,索引集S被称为β的支持,换句话说,supp(β)={i:βi6=0}。类似地,如果Xn×mis是矩阵而不是向量,则对于任何索引集S {1,2,…,m},使用xs表示由S索引的X的列。表示所有元素为1的n×1向量,Jn=nn和'Jn=nJn。索引在其他地方用对角线1和0表示单位矩阵。当维度n从上下文中清除时,下标n总是被省略。符号#S表示集合S.2.2 Minimax原型聚类和Lasso回归中的元素数。本节描述了原型聚类,用于处理Lasso回归中自变量之间的高度相关性问题。为了去除不必要的自变量,我们使用聚类方法将它们分类为相似的组,然后从每个组中选择具有较小成对相关性的代表。首先,我们定义了一个距离度量来衡量点之间的相似性(在我们的例子中,是自变量的回报)。这里,距离度量与两点的相关性相关,即d(r,r)=1- |corr(r,r)|(1),其中ri=(ri,t,ri,t+1,…,ri,t)是自变量i=1,2的时间序列向量,corr(r,r)是它们的相关性。

14
可人4 在职认证  发表于 2022-6-10 00:50:50
其次,需要确定两个集群之间的距离。一旦确定了聚类距离,就可以使用层次聚类方法(见[26])将数据组织到树中。在这些树中,每个叶对应于一个原始数据点。凝聚层次聚类算法采用自下而上的方法构建树,将每个聚类初始化为一个点,然后在每个连续阶段合并两个最近的聚类。重复此合并,直到只剩下一个集群。传统上,两个簇之间的距离定义为完整距离、单个距离、平均距离或质心距离。然而,所有这些方法都不同于解释困难和反演(这意味着父节点有时可能比其子节点的距离小),见Bien,Tibshirani(2011)[3]。为了避免这些困难,Bien,Tibshirani(2011)[3]通过极大极小关联度量引入了原型的层次聚类,定义如下。对于任意点x和簇C,letdmax(x,C)=maxx∈Cd(x,x)(2)是从x到C中最远点的距离。确定聚类的最小最大半径C asr(C)=minx∈Cdmax(x,C)(3)也就是说,它测量距离最远点x的距离∈ 它与C中的所有其他元素尽可能接近。我们将最小化点称为C的原型。直观地说,它是这个集群中心的点。然后,两个集群G和H之间的极小极大联系被定义为asd(G,H)=r(G)∪ H) 。(4) 使用这种方法,我们可以很容易地为每个集群找到一个很好的代表,这就是上面定义的原型。需要注意的是,极大极小连锁树没有反转。

15
能者818 在职认证  发表于 2022-6-10 00:50:53
此外,在下文所述的应用中,为了保证可解释性和可处理性,使用一个具有代表性的独立变量比使用其他方法(例如,主成分分析(PCA))更好,这些方法采用独立变量的线性组合。Tibshirani(1996)[45]在自变量数(p)大于样本观测数(n)时引入了LASSO方法进行模型选择。该方法基于这样一种思想,即我们不应通过最小化平方损失来推导回归的普通最小二乘(OLS)解,而应在损失中增加系数绝对值的惩罚,以最小化所选非零系数的绝对值。为了说明这个过程,假设我们有一个线性模型y=Xβ+ 哪里 ~ N(0,σ一) ,(5)X是n×p矩阵,y和 是n×1向量,β是p×1向量。β的LASSO估计量由^βλ=arg minβ给出∈卢比2nky- Xβk+λkβk(6) 其中λ>0是调整参数,它决定了对非零β绝对值的惩罚的大小。在本文中,我们使用R包glmnet【14】来定义。在随后的估计中,我们将仅使用LASSO的修改版本作为模型选择方法,以发现重要自变量的集合。选择相关基础资产后,我们对这些变量使用标准的普通最小二乘法(OLS)回归,以检验系数的优度和显著性。有关这种方法的更多讨论,请参见Zhao,Shojaie,Witten(2017)[53]。在本文中,我们对所选原型基础资产进行原型聚类,然后进行套索。

16
mingdashike22 在职认证  发表于 2022-6-10 00:50:56
该方法的理论依据见【36】和【53】。3自适应多因素模型本节介绍了自适应多因素(AMF)资产定价模型,该模型使用刚才讨论的高维统计方法进行估计。考虑到一个无摩擦、竞争激烈、无套利的市场。在这种情况下,Jarrow和Protter(2016)[21]推导出的Ross(1976)[38]APT和Merton(1973)[34]ICAPM的动态一般化意味着以下关系适用于任何证券的实际回报率:Ri(t)- r(t)=pXj=1βi,jrj(t)- r(t)= βi[r(t)- r(t)](7)其中,在时间t,Ri(t)表示1的第i个证券的返还≤ 我≤ N(其中N是证券数量),rj(t)表示用作1的第j个基础资产的回报率≤ j≤ p、 r(t)是无风险利率,r(t)=(r(t),r(t)。。。,rp(t))表示securityreturns的向量,是每个元素都等于1的列向量,βi=(βi,1,βi,2,…,βi,p)。这种广义APT要求基础资产由交易资产表示。Jarrow和Protter(2016)[21]中,基础资产的集合形成了一个代数基础,跨越了模型视界时间T的证券支付集合。无套利,即鞅测度的存在,意味着该相同的基础集适用于中间时间T的回报率∈ [0,T],其产生等式(7)中给出的基础资产风险收益关系。重要的是要强调,这种无套利关系是为了实现回报,而不是期望回报。已实现收益是应用资产定价估计的对象。其次,无套利关系需要无摩擦和竞争市场的额外假设。因此,该资产定价模型从市场微观结构考虑因素中抽象出来。

17
kedemingshi 在职认证  发表于 2022-6-10 00:50:59
因此,构建此模型结构是为了理解更大时间间隔(天或周)的证券回报,而不是需要考虑市场微观结构的日间时间间隔。与此公式一致,我们使用交易ETF作为基础资产。此外,为了应用套索方法,对于每个安全性i,我们假设只有少量的βi,jcoe系数是非零的(βihas稀疏性)。最后,为了便于估计,我们还假设βi,jcoe系数随时间保持不变,即βi,j(t)=βi,j。该假设是一个附加的限制,而不是理论所暗示的。如果我们估算中使用的时间段不太长,那么这只是一个合理的近似值(我们将随后返回到该问题)。为了实证检验我们的模型,截距α和噪声项i(t)被加到等式(7)中,即Ri(t)- r(t)=αi+pXj=1βi,j(t)rj(t)- r(t)+ i(t)=α+βi[r(t)- r(t)]+i(t)(8)其中i(t)iid~ N(0,σi)和1≤ 我≤ N、 误差项用于解释数据中的噪声和“随机”模型误差,即根据理论中包含的独立变量,无偏且无法解释的模型误差。如果我们的理论有助于解释证券回报,那么这个误差应该很小,而调整后的收益率应该很大。α截距称为詹森α截距。利用Jarrow和Protter(2016)[21]最近的理论见解,截距测试可以被解释为在无摩擦、竞争和无套利市场的假设下对广义APT的测试(更正式地说,是存在一个等价的鞅测度)。如上所述,这种方法提取了市场微观结构偏差,如买卖价差和执行速度(成本),以及战略交易考虑因素,如高频交易。

18
mingdashike22 在职认证  发表于 2022-6-10 00:51:02
为了与这种抽象一致,我们研究了一周时间间隔内的回报率,其中市场微观结构摩擦和战略交易考虑可能不太相关。如果我们不能拒绝zeroalpha,我们就会接受这种抽象,从而支持无摩擦、竞争和无套利的市场结构是“大时间尺度”证券回报的良好代表的主张。如果模型被接受,拟合优度测试将量化模型相对于安全回报中实际时间序列变量的解释力。调整后的R在这方面提供了良好的测试。GRS测试通常是测试截获的一个很好的程序,但它不适用于套索回归设置。相反,如果我们拒绝零阿尔法,那么这是符合以下两种情况的证据:(i)微观结构考虑对于理解“大时间尺度”和“短时间尺度”回报是必要的,或者(ii)市场中存在套利机会。第二种可能性与广义APT是对真实性的有效描述相一致,但在市场失效的情况下。为了区分这两种备选方案,我们注意到,非零截距能够识别这些“所谓”的套利地理机会,通过形成利用这些“正阿尔法”存在的交易策略构建在短时间内使用每周收益率需要使用高维统计。要了解原因,请考虑以下内容。

19
大多数88 在职认证  发表于 2022-6-10 00:51:05
对于给定的时间段(t,t),让n=t- t+1,我们可以使用时间序列向量asRi重写方程(8)- r=αin+(r- rp)βi+i(9)其中1≤ 我≤ N我~ N(0,σiIn)和ri=Ri(t)Ri(t+1)。。。Ri(T)n×1,r=r(t)r(t+1)。。。r(T)n×1,我=i(t)i(t+1)。。。i(T)n×1(10)βi=βi,1βi,2。。。βi,pp×1,ri=ri(t)ri(t+1)。。。ri(T)n×1,r(t)=r(t)r(t)。。。rp(t)p×1(11)r=(r,r,…,rp)n×p=r(t)r(t+1)。。。r(T)n×p,R=(R,R,…,RN)(12)回想一下,我们假设系数βij是常数。只有当时间段(t,t)很小时(比如三年),这个假设才是合理的,所以观测的数量n≈ 150鉴于我们采用每周数据。因此,我们在该回归中的样本量n大大小于基础资产的数量p。我们使用GIBS算法选择基础资产集S(S在接近尾端时得出)。然后,模型变得- r=αin+(rS- (r) Sp)(βi)S+i、 (13)在这里,可以测试每个基础资产的截距和重要性,使其身份y=Ri- 兰德X=r- rpin方程(5)。可以使用拟合优度检验、样本内调整R的比较和样本外预测R[6]。方程式(13)的一个例子是Fama French(2015)[13]五因素模型,其中所有基础资产都是风险因素,获得非零预期超额回报。

20
大多数88 在职认证  发表于 2022-6-10 00:51:08
这里,五个交易风险因素是:(i)市场投资组合减去即期利率(Rm- Rf),(ii)代表小型(市场资本)公司与大型(市场资本)公司(SMB)业绩的投资组合,(iii)代表高账面市盈率公司与小型账面市盈率公司(HML)业绩的投资组合,(iv)代表稳健(高)盈利公司与弱(低)盈利公司(RMW)业绩的投资组合,(v)代表保守投资公司和积极投资公司业绩的投资组合(CMA),即Ri(t)- r(t)=αi+βmi(Rm(t)- r(t))+βsiSMB(t)+βhiHML(t)+βriRMW(t)+βciCMA(t)+i(t)。(14) Fama French五因子与方程(13)之间的关键区别在于,方程(13)允许不同的证券与不同的基础资产相关,其中许多可能不是风险因素,从比这五个更大的基础资产集合中选择。事实上,我们允许基础资产p的数量相当大(例如超过1000),这使得不同证券的非零系数β的数量不同。如上所述,我们还假设系数向量βito是稀疏的。包括Fama-French五因素模型在内的传统头韵将回归限制在少数风险因素。相反,使用LASSO方法,只要β系数是稀疏的且基础资产不是高度相关的,我们就能够在p>n时使用时间序列数据建立模型。如前所述,我们处理第二个issuevia聚类方法。4估算程序(GIBS算法)本节讨论基础资产隐含自适应多因素(AMF)模型的估算程序。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 06:01