楼主: 能者818
1504 48

[量化金融] 金融市场结构与实体经济的关系: [推广有奖]

41
kedemingshi 在职认证  发表于 2022-5-6 07:00:35
我们选择了ICB行业分类,该分类产生19个不同的超级部门,这些超级部门依次聚集在10个行业中:图12中报告了属于每个ICB超级部门的股票百分比。图13显示了两个图,总结了该数据集的主要特征。图表显示了平均价格P(t)≡价格的平均回报率≡NPiri(t),作为时间的函数。从这些图中,我们可以看到,互联网泡沫破裂(2002年)和信贷紧缩(2007-08年)都是由市场动态表现出来的。尤其明显的是,这两个时期的波动性都急剧增加,在时间上具有很强的自相关性:这是对数收益动态的一个众所周知的特征[32]。在2010年和2012年的信贷危机之后,也可以观察到这种波动性。S2。聚类方法:简要回顾我们的重点是最能描述市场相互依赖关系的层次结构(树状图),以及这种结构的聚类特征。为此,第一步是确定股票对之间的适当距离,了解它们之间的相关性。适当的函数[1]是Dij=p2(1- Cij):可以证明,通过这种选择,距离度量的三个属性是不同的。1996 1998 2000 2002 2004 2006 2008 2010 2012 20142025303540455055t’P(t)平均价格a)1996 1998 2000 2002 2004 2006 2008 2010 2014-0.2-0.15-0.1-0.0500.050.10.15t’r(t)平均原木返回量b)图13。1997年1月至2012年12月数据集的平均价格和日志回报。

42
大多数88 在职认证  发表于 2022-5-6 07:00:38
a) 数据集中342只美国股票的平均价格P(t);b) 相同价格的平均对数回报率r(t)。然后,我们最终得到一组N×N距离矩阵D(tk)和DR(tk),我们应用两种不同的、众所周知的工具来揭示隐藏的(未知的)依赖结构:o单链接(SL),这是一种分层聚类算法。给定距离矩阵,它开始为每个对象分配自己的簇,然后在每一步将最近(即最少持续)的簇对合并为一个新簇,直到只剩下一个簇。两个通用聚类A和B之间的距离每次都根据公式B=mina定义和更新∈A、 b∈BD(a,b)(15)SL被称为凝聚簇,因为它从N个簇的划分开始,然后进行合并。该方法的最终输出是一个树状图,该树状图显示了SL发现的层次结构。该树状图中定义的距离度量是超度量距离[1]。通过选择聚类数(这是一个自由参数)并在适当的水平上切割树状图,可以获得股票的适当聚类划分。该算法与给定距离矩阵D的最小生成树(MST)算法密切相关。MST是一种以股票为节点的树图,自Mantegna[1]的工作以来,它一直被用作经济物理学中的拓扑工具。它可以从一个空图开始生成:将C中的所有相关性按降序排序后,在相关性最高的两个股票/节点之间添加一个加权链接,然后继续进行下一对相关性;每当要添加的新链接生成循环时,不要添加该链接并跳到下一个链接,直到选中所有列表。这棵树正好含有N- 1链接。

43
可人4 在职认证  发表于 2022-5-6 07:00:41
可以看出[16]MST算法基本上是SL过程,直到图形完全连接。因此,这两种工具之间存在着严格的关系。然而,MST保留了SL树状图丢弃的一些信息[16]。o平均链接(AL)是一种类似于SL的分层聚类算法。该算法与SL下的算法相同,但等式17替换为:dA,B=meana∈A、 b∈BD(a,b)(16)o完全连接(CL)是SL的第三种变体,其中等式17被替换为:dA,b=maxa∈A、 b∈BD(a,b)(17)o定向气泡层次树(DBHT)[21],一种新的层次聚类方法,利用PMFG(平面最大过滤图)的拓扑特性来发现聚类。PMFG是MST的推广,它作为子图包含在PMFG中。其构造遵循MST的相同程序,但非环路条件与较弱的平面性条件(即每个添加的链路不得切割预先存在的链路)不同。由于这种更宽松的拓扑约束,PMFG能够比MST保留更多的链接和信息。特别是,可以证明每个HPMFG正好包含3(N- 2) 链接。PMFG的基本元素是三个团,由三个节点组成的子图,所有节点都相互连接(即三角形)。DBHT利用这种拓扑结构,尤其是分离和非分离三个派系之间的区别,来识别PMFG中所有节点的聚类分区[21]。

44
kedemingshi 在职认证  发表于 2022-5-6 07:00:44
然后,通过传统的聚集聚类过程,得到完整的层次结构(树状图),包括簇间和簇内。链接算法查看已排序的距离列表,并通过收集距离最小的股票子集来构建树状图;然后,如我们所说,在选择参数“簇数”后,从树状图中获得聚类。DBHT相反地颠倒了顺序:首先通过平面图上的拓扑考虑来识别所有簇,然后构建簇间和簇内的层次结构。因此,差异既包括所利用的信息类型,也包括方法论方法k-medoids是一种与k-means密切相关的划分聚类方法[26]。它将集群的数量作为输入。该算法就是所谓的围绕medoid的划分(PAM),具体如下:1。在N个元素中随机选择Ncl“medoids”;2.将每个元素指定给最近的medoid;3.对于每个medoid,用分配给它的每个点替换medoid,并计算每个配置的成本;4.选择成本最低的配置;5.重复2)-4)直到没有变化。这种方法和这里考虑的其他方法一样,不是分层方法,因此不提供树状图,而只提供分区。集群标签库存数量单联汽车和零件银行基本资源计划建筑和材料金融服务食品和饮料健康护理工业产品和服务保险中介石油和天然气个人和家居用品房地产技术企业通讯水平和休闲设施1 2 3 4 6 7 8 10111213116170102040506070DBHTC库存数量集群标签图14。

45
能者818 在职认证  发表于 2022-5-6 07:00:47
基于非去趋势对数回报的ICB超行业DBHT集群的股票数量和组成。构图是用不同的颜色表示的。S3。聚类组合:非去趋势的caseDBHT聚类组合在图14中,我们报告了通过使用非去趋势的日志返回,将DBHT方法应用于整个数据时间窗口(1997-2012)获得的聚类的图形摘要。DBHT返回的簇数Ncl等于17。第四大类由62只股票组成,约占股票总数的18%;第9组最小,包含4只股票。集群的平均规模为20.1只股票。正如我们所看到的,四个集群显示了只属于一个ICB超级部门的股票组成:集群9和13(石油和天然气)、11(技术)和14(公用事业)。类似的例子包括第8组,其中科技股超过86%,第15组,其中91%的股票来自零售,第16组(75%的股票来自医疗保健)和第17组(87.5%的股票来自食品和饮料)。此外,还有一些集群,虽然呈现出混合的组成,但由严格相关的超级部门组成:第6个由银行、金融服务和保险组成,所有超级部门都是ICB在同一行业(金融)的上级层级中聚集的。对于某个特定的超级部门或行业,有一些集群没有表现出过度表达:这一事实指出,集群毕竟提供了一种信息,不能仅限于行业分类。特别是集群1、3和12的组成不均匀,几乎覆盖了所有19个超级部门,没有哪个部门主导其他部门。集群4是一个中间案例,因为尽管它过度表达工业产品和服务(75%),但它包含属于9个不同超部门的库存。

46
可人4 在职认证  发表于 2022-5-6 07:00:51
有趣的是,最大的集群(4、12、1和10)都是这些类型的“混合”集群。其他聚类组合我们在这里对相同的数据应用其他聚类方法,并将结果与DBHT聚类进行比较。考虑的聚类方法有单连杆法(SL)、平均连杆法(AL),完整链接(CL)1 2 3 4 5 6 7 8 9 1011121314151617050100150200250300350StocksCluster labelNumber of stocksCluster Labela)1 2 3 4 5 6 7 8 1011121314151617050100150200250300350 stocksCluster labelb的平均链接编号1 2 3 4 5 6 8 10111241516141516170702040608010140140 stocksCluster labelc的完整链接编号1 2 3 4 5 6 6 8 1011121314151617020408010120140k medoidsNumberstocksCluster labeld)图15。对于不同的聚类方法,在非去趋势对数回报上,根据ICB超部门的聚类组成。x轴代表单个集群标签,y轴代表每个集群中的股票数量。每种颜色对应一个ICB超反射体(图例与图14相同。图表显示了a)SL聚类的结果,b)AL,c)forCL和d)k-medoids。和k-麦迪奥德。后者不是一种层次聚类方法,因此它不提供树状图:然而,我们对其进行了分析,以将我们的结果与一种成熟的聚类方法进行比较。与DBHT不同的是,聚类数是这些方法的自由参数,在这些情况下选择为17,以便将条形图与DBHT的图14进行比较。我们在无花果中绘图。

47
能者818 在职认证  发表于 2022-5-6 07:00:54
15 a)、b)、c)和d)通过使用这四种聚类方法获得的簇组成,即SL、AL、CLand k-medoids。首先,我们可以观察到,对于它们中的每一个,集群的大小都有很强的异质性:SL和AL分别显示了323和322个股票的两个巨大集群(几乎相同,共有318个股票),其他集群由一个、两个或三个股票组成。对于这两种算法,这个巨大的集群包含所有ICB部门的股票。对于CL和k-medoids,情况截然不同。对于CL来说,巨型集群(集群编号10)的规模大大缩小(136只股票),其他三个集群(数字12、9和5)也包含相应数量的股票(分别为50、33和25只):过度表达的主要超级群体是技术(集群12)、公用事业(集群5)、零售(集群9)、石油和天然气(集群16)和医疗(集群2)。k-medoids的结构非常相似,但巨型星团进一步分裂成两个大星团(7和10)。然而,DBHT聚类显示了ICB超切分体的大小和过度表达的最大程度的同质性,至少对于这个数量的聚类来说是如此(比较见图14)。将这些结果与对去趋势对数收益率的相同分析(本文中的图3和图4)进行比较,我们可以得出结论,市场模式的减法使所有聚类方法(SL除外)在规模上更加同质,并且更能够检索ICB分区。SL clusteringinstead似乎对这种减法不敏感,即使在去趋势的情况下,也不会过度表达任何ICB超反射体(图4a))。S4。

48
可人4 在职认证  发表于 2022-5-6 07:00:57
稳健性的自举测试自举技术的基本思想如下[42]:假设,对于长度为L的给定时间窗口,我们有N个时间序列(每个股票一个),每个时间序列的长度为L。我们可以把这些数据放在一个N×L矩阵中,比如X,然后计算它的相关矩阵,比如ρ,以及使用DBHT的聚类,比如Y。现在,让我们为矩阵X创建一个副本XO,这样X的每一行在X的行中随机绘制,允许相同行的多个图形。从X我们可以再次计算相关矩阵ρ和聚类Y。通过不时重复这个过程,我们最终得到了一系列聚类,由于X和其副本之间的差异,每一个聚类都与原始聚类略有不同。该复制扫描样本可用于测试原始聚类Y中测量的任何数量的稳健性,例如聚类数。这可以通过检查原始度量值是否与副本的分布相兼容来实现,例如执行统计假设检验。0 100 200 300 400051015202530NclNDBHTa)0 100 200 300 400051015202530NclNAverage Linkage b)0 100 200 300 400051015202530NCLcomplete Linkage c)0 100 200 300 400051015202530NCLsingle Linkaged)集群标签库存数量单联汽车和零件银行基本资源计划建筑和材料金融服务食品和斜面健康护理工业产品和服务保险业GasPersonal&Home Goods Real EstatereTailtechnology ytelecommunications Strave&Leisure Utilities 0 100 200 300 400051015202530 NCLK Medoidise)图16。ICB超抗原在不同层次上过度表达。根据超几何假设检验(即被拒绝的检验次数),每个条形图显示了一个ICB超反射体被一个簇过度表达的次数(N),改变了簇Ncl的数量。

49
大多数88 在职认证  发表于 2022-5-6 07:01:00
每种颜色显示每个ICB超切面的过度表达数量。图a)-e)分别显示了DBHT、AL、CL、SL和k-medoids聚类的结果。相关性是根据非去趋势日志返回计算的。50 100 150 200 250 30000.10.20.30.40.5NclN′DBHTa)50 100 150 200 250 30000.10.20.30.40.5NclN′完整链接b)图17。ICB超射体在超几何测试中以成对簇/超射体的百分比过度表达。每个条形图显示,根据超几何刺激试验(即被拒绝的试验数量),不同簇Ncl的数量,ICB超切分体被簇过度表达的次数(N)除以执行的超几何试验总数(0.5×Ncl×NICB,含NICB ICB超切分体的数量):N=2nnl×NICB。每个颜色显示每个ICB超切面的过度表达数量。图a)-b)分别显示了BHT和CL聚类的结果。相关性是根据DetrendLog返回值计算的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-1 20:14