楼主: 何人来此
1761 55

[量化金融] 高维估计、基础资产和自适应多因素 [推广有奖]

21
可人4 在职认证  发表于 2022-6-10 00:51:11
为了克服高维和高相关性的困难,我们提出了一种分组可解释基选择(GIBS)算法来经验估计AMF模型。本节给出了详细信息,GIBS算法的技巧如本节末尾的表1所示。该数据包括2014年1月至2016年12月三年期间CRSP数据库中可用的证券回报和所有ETF。同样的方法也可用于其他时间段。然而,在早期,没有ETF。此外,在基础资产集合中,我们包括五个Fama Frenchfactors。只有当证券的价格在所有交易周的80%以上时,我们才将其包括在样本中。为了便于比较,公司根据其SIC代码的前2位进行分类(SIC代码类的详细描述见附录B)。假设我们得到了可追溯基差资产r,r。。。,rp.在我们的调查中,这些是交易ETF的回报,为了与文献进行比较,Fama-French5因素。根据最近一年的数据,ETF的数量很大,略高于1000只(p≈1000). 由于这些基础资产高度相关,因此对Ri进行估值存在问题-r使用套索回归对这些基础资产进行校正。因此,我们使用第2.2节中讨论的原型聚类方法,通过选择低相关代表来减少基础资产的数量。然后,我们将LASSO回归的修正版本提供给这些低相关代表。这提高了拟合精度,并选择了更稀疏、更易解释的模型。为便于记法,表示yi=Ri- r、 Xi=ri- r、 Y=r- r、 X=r- r(15),其中Ri,r,Ri,r的定义在方程式(9-12)中。让RDE注意市场回报。

22
kedemingshi 在职认证  发表于 2022-6-10 00:51:14
很容易检查大部分ETF基础资产是否与X(市场回报率减去无风险利率)相关。我们注意到,这一模式不适用于其他四个Fama-French因素。因此,在进行聚类和套索回归之前,我们首先将其他基本集正交化为X。通过对市场收益率进行正交分析,我们避免了选择类似于ITAN的冗余基差资产,同时提高了拟合的准确性。请注意,对于OLS,投影不会影响估计,因为它只影响系数,而不会影响估计的^y。然而,在套索中,投影会影响选定的基础资产集,因为它会改变收缩的幅度。因此,我们计算Xi=(I- PX)Xi=(I- X(XX)-1X)XI其中2≤ 我≤ p(16),其中px表示投影运算符。表示向量fX=(X,fX,fX,…,fXp)。(17) 请注意,这相当于将市场回报率减去无风险利率后的其他基础资产回归后的残差。转换后的ETF基础资产FX包含高度相关的成员。我们首先将这些基础资产分为A、A、…、。。。,AK基于他们的财务解释。请注意≡ ∪ki=1Ai={1,2,…,p}。更多描述的类别列表见附录C。这些类别包括(1)债券/固定收益,(2)商品,(3)货币,(4)多元化投资组合,(5)股票,(6)另类ETF,(7)反向,(8)杠杆,(9)房地产和(10)波动性。接下来,我们需要从每个类别中选择一组代表。这些代表应该跨越他们所属的类别,但彼此之间的相关性也很低。

23
可人4 在职认证  发表于 2022-6-10 00:51:17
这可以通过使用原型聚类方法来实现,距离由等式(1)确定,这会产生每个集群内的“原型”(代表)(直观地说,原型位于每个集群的中心),相关性较低。在每个类别中,我们使用前面讨论的原型聚类方法来查找代表集。可以根据相关阈值确定每个类别中的代表人数。(或者,我们也可以使用PCA维度或其他参数调整方法来确定原型的数量。请注意,即使我们使用PCA维度来建议要保留的原型数量,GIBS算法也不会像PCA那样使用任何因素的线性组合)。这给出了集合B,B。。。,BK带Bi Aifor 1≤ 我≤ k、 表示B≡ ∪ki=1Bi。虽然该简化程序保证了每个Bi中元素之间的低相关性,但它不能保证联盟B中元素之间的低相关性。因此,需要额外的步骤,即在B上进行原型聚类,以找到低相关性代表集。请注意,U B、 表示p≡ #U、 附录D表18给出了集合U中所有ETF的列表。这仍然是一个p=186的大集合。回想一下2.1节的注释,fxu表示由集合U索引的矩阵xfx的列。由于基础资产infxu不是高度相关的,因此可以应用LASSOregression。通过等式(6),我们得到eβi=arg minβi∈Rp,(βi)j=0(j∈坎特伯雷大学)2n个易-fXβi+ λkβik(18) 其中uc表示U的补码。然而,这里我们使用与传统套索不同的λ。通常通过交叉验证选择套索的λ。然而,这将超过第6节中讨论的数据。因此,这里我们使用λselect规则的修改版本,并设置λ=max{λ1se,min{λ:#supp(eβi)≤ 20} }(19),其中λ1s是由“1se规则”选择的λ。

24
何人来此 在职认证  发表于 2022-6-10 00:51:20
“1se规则”给出了最规则化的模型,使得误差在交叉验证实现的最小误差的一个标准误差范围内(见[14,39,46])。关于λ选择的进一步讨论见第6节。选择的基础资产集isSi≡ 补充(eβi)(20)接下来,我们对选定的基础资产进行普通最小二乘(OLS)回归。由于这是一个OLS回归,我们使用原始基础资产XSirather,而不是理论化基础资产相对于市场回报fxsi。通过这种方式,我们构建了基础资产Si的集合。请注意,在这里,如果未选择,我们还可以将Fama French 5因子添加到Siif中,这也将在第6节中作为GIBS+FF5模型进行讨论。这是为了将结果与文献进行比较。然而,第6节中GIBS和GIBS+FF5模型之间的比较结果表明,将Fama French 5因子添加到父系中会导致过度拟合,应避免。因此,如果未在上述程序中选择,此处采用的GIBS算法不包括Fama-French 5因素。以下OLS回归用于估计^βi,βiinYi=αin+XSi(βi)Si+i、 (21)注意supp(^βi) 硅。从该估算中获得的调整后Ris。由于我们处于OLS状态,可以对^βi进行重要测试。这会产生一组重要的系数*我≡ {j:PH(|βi,j |≥ |其中H:真值βi,j=0。(22)请注意,重要基础资产集是所选基础资产集的子集。换句话说,S*我 补充(^βi) 硅 {1,2,…,p}。(23)综上所述,GIBS算法示意图如表1所示。

25
mingdashike22 在职认证  发表于 2022-6-10 00:51:23
回想一下第2.1节的旋转,对于索引集S {1,2,…,p},FXS表示集合S索引的矩阵X的列。我们在这里提出的GIBS算法的一些后续测试和应用可以在[58,60,23]中找到。一些相关作品可在[59、57、31、19、18、25、54、35、9、52、33、32、41、42、40、10、30、8、50、56、55、4]中找到。分组可解释基础选择(GIBS)算法输入:股票到资产和基础资产X.1。使用X和方程式(16,17)导出fx。2、根据财务解释,将转换后的基础资产FX分为k组A、A、··························································。3、在每组中,使用原型聚类来发现原型Bi 人工智能。4、设B=∪ki=1Bi,在B中使用原型聚类来查找原型U B、 5。对于每个股票Yi,使用LASSO的修改版本将EFXu还原为选定的基础资产FXSI6。对于每个股票Yi,在XSi上拟合线性回归。输出:选定因素Si,重要因素S*i、 以及步骤6中的系数。表1:分组可解释基差选择(GIBS)算法的草图对于了解哪些基差资产影响哪些证券也很重要。鉴于证券集合相当大,研究哪类基础资产影响哪类证券更为合理。附录C中给出了基础资产的类别,附录B中给出了按SIC代码前2位分类的证券类别。对于每个证券类别,我们计算了重要基础资产类别的数量,如下所示。请记住,N是证券的数量。表示l是SecurityClass的数量。用C,C,C,…,表示安全类。。。,ClwhereSld=1Cd={1,2,…,N}。回想一下,基础资产的数量是p。

26
nandehutu2022 在职认证  发表于 2022-6-10 00:51:26
设基本资产类别的数量为m。将基本资产类别表示为F、F、F、。。。,FmwhereSmb=1Fb={1,2,…,p}和pis至少对一种证券i重要的基础资产数量。也可称为*我 方程(22)中的{1,2,…,p}。将重要计数矩阵表示为beA={ab,d}m×lwhereab,d=Xi∈Cd#{S*我∩ Fb}。(24)也就是说,每个元素ab,dof矩阵A是由d类证券选择的基础资产b类中重要基础资产的数量。最后,表示比例矩阵beG={gb,d}m×lwheregb,d=ab,dP1≤j≤maj,d.(25)换句话说,每个元素gb,dof矩阵G是由d类证券选择的b类基础资产中的重要基础资产在d类证券选择的所有基础资产中的比例。请注意,G每列中的元素总和为1。5估计结果我们的结果表明,GIBS算法从至少一家公司的不同部门中选择了总共186项基础资产。在至少一家公司选择GIBS后的第二阶段OLS回归中,所有这186项基础资产都很重要。这验证了我们的假设,即基础资产的总数很大;远远大于10个基础资产,这通常是文献中所见的具有非零风险溢价(风险因素)的基础资产的最大数量(见Harvey,Liu,Zhu(2016)[16])。图1:基础资产数量的分布。左图显示了GIBS选择的基础资产数量的历史图。

27
mingdashike22 在职认证  发表于 2022-6-10 00:51:29
在右侧,我们报告了第二步OLS回归中5%水平的重要基础资产数量柱状图。此外,结果验证了我们的稀疏性假设,即每家公司仅与少量基础资产存在显著相关性(显著性水平为5%)。事实上,对于每家公司,GIBS选择的平均基础资产为3.4,平均基础资产为2.2,在第二阶段OLS回归中显示出显著性。(即使使用第6节中讨论的传统交叉验证方法进行过度拟合,也只选择了13.4个基准资产的平均值。)换句话说,Si中元素的平均数量(见等式20)为3.4,Si中元素的平均数量(见等式22)为2.2。图1显示了GIB选择的基础资产数量的分布以及第二阶段OLS回归中重要的基础资产数量。如图所示,大多数证券的~ 10重要基础资产。因此,高维方法在这里是适当和必要的。表2提供了矩阵G的百分比。每个网格为100·gb,其中为gb,定义见等式(25)。图2是一个热图,从中我们可以看到表2中的模式。网格越暗,重要基础资产的百分比越大。如图所示,不同的证券类别取决于不同类别的基础资产,尽管一些基础资产似乎是共享的。在我们的模型中,如果存在额外的基础资产,并非所有的Fama French 5风险因素都是显著的。只有marketportfolio对几乎所有证券都显示出强大的重要性。新兴市场股票和货币市场ETF基础资产似乎也影响了许多证券。

28
能者818 在职认证  发表于 2022-6-10 00:51:33
如图所示,需要所有基础资产来解释证券回报,不同的证券与少量不同的基础资产相关。图2:重要计数百分比的热图。每个网格与公司集团在相应部门(以行名称显示)中选择的基础资产百分比相关(以列名称显示的SIC代码分类)。图中显示,不同的公司集团可能会选择一些共同的基础资产,但也可能会选择不同的基础资产部门。ETF ClassSIC First 2 digits01 07 08 10 12 13 15 16 17 20 21 22 23 24 25-28 29-31 32市场回报率29 0 7 21 27 6 19 36 22 25 29 44 23 25 31 SMB 14 0 33 5 11 6 22 27 16 41 22 25 16 HML 0 0 6 16 6 6 6 6 3 10 6 0 10 10 3 RMW 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 10 8 6 CMA 0 0 0 7 5 2 0 11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 14 3参考。库存/转换。债券0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0所有市值股票0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 8 1 3 6建筑&建筑0 0 0 0 0 0 19 50 11 9 0 0 6 0 15 1 12商品生产者股票0 25 0 8 0 3 19 0 0 2 0 0 0 0 1 3消费者Discrtnry。

29
kedemingshi 在职认证  发表于 2022-6-10 00:51:37
股票0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 17 0 1 6 0消费类大宗商品股票0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 20 0 0 0 6 0 1 0金融类股票0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 3健康与生物技术类股票0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 0大盘股成长型股票29 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1个0 0材料0 0 33 3 11 2 6 0 0 0 1 0 0 0 15 1 1 0技术股票0 0 2 0 0 0 0 3 0 0 2 0 0 0 2 3运输股票0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0公用事业股票0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0。该表提供了矩阵Gin百分比(每个网格为100·gb,其中为gb,定义见等式(25))。每个网格是公司集团在相应部门(以行名显示)选择的基础资产百分比(以列名显示的SIC代码分类)。请注意,每列中的元素加起来等于100,这意味着100%(由于舍入问题,可能与100略有不同)。省略百分号以节省空间。ETF ClassSIC First 2 digits33-38 39 40 42 44 46 47-51 52 53 54 55 57 58 60 61市场回报28 32 10 27 30 29 26 32 30 36 33 30 32 21 33 SMB 24 23 10 27 20 20 13 25 11 30 15 19 19 23 19 27 HML 7 0 0 3 7 2 0 0 18 5 5 5 5 5 5 18 RMW 6 9 0 7 0 5 6 0 10 10 10 2 14 9 3 2cma 7 10 3 0 3 0 0 3 0 5 0 5 0 8 0 0 0 4 2 3 3 3参考。库存/转换。

30
能者818 在职认证  发表于 2022-6-10 00:51:40
债券0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 1 0总债券市场1 5 10 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 6贵金属0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3亚太地区股票1 0 0 15 0 5 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 5生成(&2)建筑业1 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0社区生产者股票1 0 0 2 2 1 0 0 0 0 0 0 0 0 1 0 0消费者Discrtnry。股票2 5 0 0 0 0 0 2 17 42 15 18 34 19 1 18 1 0消费类大宗商品股票0 9 0 0 4 2 1 0 0 0 0 0 0 0 0 1 2金融股票1 5 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 13 3国外大盘股股票0 0 0 0 0 0 0 0 0 2 0全球股票1 0 0 3 0 4 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2健康与生物技术股票2 0 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0大盘股增长股票1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0个1材料1 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 1 0 0 0 0 0 0技术股票6 5 0 0 0 0 0 2 1 0 0 0 0 0 2 5 0 0 3 0 2运输股票0 0 30 24 0 15 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0。ETF ClassSIC First 2 digits62 63 64 65 67 70-73 75 76 78 79 80 82 83 87 89 96 62 63 65 67 70 75 76 78 80 82 83 87 94 99市场回报29 24 39 29 21 32 29 50 25 33 25 38 38 33 27 SMB 14 18 11 19 8 25 29 50 31 30 34 25 23 12 33 26 HML 13 14 7 5 0 0 0 0 4 7 0 9 0 9 RMW 4 6 11 6 3 8 14 0 19 7 6 0 8 0 8 8 0 0 8 8 0 8 8 8 8 0 6 0 8 11 CMA 9 7 3 4 0 0 0 0 4 0 0 0 0 4 0 0 0 0 4 0 0 0 0 0 0 0 0 4参考。库存/转换。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-26 19:41