楼主: 可人4
706 17

[量化金融] 提出了一个方法论框架和实验指南,以 [推广有奖]

11
能者818 在职认证  发表于 2022-5-10 11:55:14
我们希望验证,将从现有时间序列构建的合成时间序列添加到聚类周长不会改变原始聚类结构。聚类结构应适用于为填补缺失数据或清除其劣质而执行的统计工程。三、 来自稳定性基准测试的见解a。CDS数据网将提出的扰动框架应用于信用违约掉期(CDS)时间序列的数据,可在www.datagrapple上查看。通用域名格式。该数据集包含450个实体,这些实体从2006年1月到今天都有完整的历史日价格,即给定到期日(比如5年合同)上给定资产(比如诺基亚Oyj)的日价格超过2300,还有250多个实体缺少数据(比如NumericableGroup S.a.),这些实体缺少的历史价格是使用机器学习算法估算的。由于信用违约掉期在场外交易,可以任意选择定价的收盘时间,即格林威治标准时间下午5点,即伦敦证券交易所交易日之后。CDS价格的这种同步调整避免了因不同关闭时间而产生的虚假相关性。例如,使用接近收盘的股票价格会高估市场内的相关性,低估市场间的依赖性,因为它们有不同的交易时间[21]。此外,除了可以公开获取之外,该数据集的另一个好处是,历史价格是根据主要CDS市场庄家提出的最佳出价/最佳出价的合成实时订单簿计算得出的中端市场数据,而不是可能无法交易的平均共识。B.金融时间序列的预处理给定N个价格时间序列Pi(t),i=1,N、 t=1,标准方法包括处理日志返回的时间序列 对数Pi(t)=对数Pi(t+1)- 对数Pi(t)。

12
能者818 在职认证  发表于 2022-5-10 11:55:17
这种转换通过对所考虑的时间序列进行经验性平稳化,同时对变化进行标准化,从而降低了伪相关性的风险。因此,聚类然后是时间序列 对数Pi(t),t=1,T使用基于皮尔逊相关的距离或欧几里德距离可能更相关。在[20]中,作者声称标准欧几里德距离不应用于金融时间序列的聚类。例如,假设两个时间序列X和Y的变化是独立的,并且根据N(uX,σX)和N(uY,σY)相同地分布,我们有e[(X- Y)]=(uX- uY)+(σX- σY)+2σXσY(1)-ρ(X,Y))。如果X和Y是独立的,那么ρ(X,Y)=0和E[(X- Y)]=(uX- uY)+σX+σY。现在,假设uX=uyan,σX=σY,X和Y之间的距离2σX与方差成比例增长,这对于两个变化具有相同分布的时间序列来说是不合适的行为。根据观察到的欧氏距离混合了相关性和分布信息,但不适合它们的用途,作者设计了一种形式为D相关+D分布的距离,用于比较I。i、 d.相关性和分布信息的随机过程。利用他们的距离,我们可以直接工作Pi(t)=Pi(t+1)- Pi(t),因为对数变换是无用的:依赖关系(基于斯皮尔曼相关)和分布(海林格)距离都是数据的不变的非单调变换。因此,我们将继续努力 当使用dp和DE进行集群时,记录Pi(t),等等当使用DSD和DG进行聚类时,Pi(t)。在剩下的实验中,weapply为这两个实验提供了一个层次聚类,称为加权链接,通过一个恒定的高度切割得到K=16个聚类;给出的结果仍然适用于不同的值和不同的聚类算法。C

13
mingdashike22 在职认证  发表于 2022-5-10 11:55:20
使用微扰框架比较距离在本节中,我们利用提议的微扰框架来测试用于聚类的四个距离:财务数据Pari 0.46DSARI 0.71 DEARI 0.47DGARI 0.90Fig。2:对奇偶扰动的稳定性,以及相关的ARI,表明基于DG的聚类具有更好的稳定性;基于DS的聚类得到的分区非常相似,但不太稳定。我们还观察了一些关于CDS市场的程式化事实。四个距离DP、DS、dea和dg本质上分别是基于皮尔逊相关、斯皮尔曼相关、欧氏距离和最近引入的基于相关和分布的距离。Weill用数据可视化aSankey图来说明聚类稳定性,该图突出了分区之间的差异[22]。在图2中,我们展示了奇偶实验的稳定性结果。对于每个距离,我们都显示了奇数交易日样本(左)和偶数交易日样本(右)上获得的分区。灰色链接将左分区中的给定集合绑定到右分区中的同一资产。因此,通过左集群和右集群之间的一一对应,可以显示一个完全稳定的集群。DivergingEdge突出显示分区之间的不匹配,将鼠标悬停在边缘上显示从集群切换的资产。在这个实验中,这些资产可能是具有不寻常历史的资产,例如,由于合并(M&a)、灾难或灾难,它们可能在某一天遇到了强烈的变化。但是,当然,由于群集方法的缺点,可能会发生群集切换。图3所示的心脏与尾巴实验展示了一个关于CD市场的有趣的程式化事实。对于这种微扰,聚类相关(DSD和DP)根本不稳定。

14
nandehutu2022 在职认证  发表于 2022-5-10 11:55:25
这意味着,市场上最强劲的波动样本的聚类结构与仅考虑相关性时最温和的波动样本完全不同。这是可以解释的,因为当市场处于紧张状态时,宏观经济紧张局势往往会影响所有参与者,资产之间的相关性变得显著更高,所有资产都类似,因此变得不具信息性。这一说法得到了以下事实的支持:基于皮尔曼相关性(秩间相关性)的数据集表现最差,而基于皮尔逊相关性(已知会因厚尾变化而降低)的数据集表现出更好的稳定性,因为这种基于相关性的距离无意中对分布进行了区分。对于较高的ρ值(在应激期就是这种情况),对变异的均值和方差进行去区分,因此比基于相关性的距离表现得更好。最后,对这两种信息都有意向性作用的DG可以利用分布信息,在压力期和较安静期之间获得相当稳定的聚类。在图4中,我们展示了成熟度实验的结果。对于每个聚类,我们显示了5个分区,分别对应于1年、3年、5年、7年、10年的CD。我们可以注意到,与1年期CDS相对应的部分是较不稳定的PARI 0.24DSARI 0.09DEARI 0.31DGARI 0.43Fig。3:不同位置和相关ARIDPDSDEGFIG的心脏稳定性与尾部扰动。4:稳定性到成熟度扰动无论使用的距离如何。这可以用1年期债券相对流动性不足来解释,与其他债券相比,由于做市商的报价稀少且嘈杂。DSD和DG的稳定性较高,DPD和DEW的稳定性异常低,而信息基本相同。图5描绘了多尺度实验的结果。

15
大多数88 在职认证  发表于 2022-5-10 11:55:28
6分别考虑1、2、4、8、16、32个交易日的变化,得到的聚类对应的每个距离显示6个分区。我们可以观察到一个典型的事实,即聚类结构持续到每周采样,并且聚类结构基本上由相关性决定,这是由DSD和DP实现的高稳定性所倡导的。DG再一次利用其与DS类似的相关部分相对稳定。最后,我们用经济区域扰动来总结这项实证研究。在图6中,我们显示了与在不同经济时期获得的聚类相对应的4个分区。从左到右依次是2006-2007年的次贷危机前时期、2008-2009年的次贷危机时期、2011-2012年的欧洲债务危机以及2013-2014年的量化宽松。我们可以在图6中注意到,与下面的情况相比,2006-2007年期间产生了非常不同的集群。事实上,从图1可以看出,市场的相关性非常低。除DG聚类外,其他方法得到的聚类都是不稳定的。从基于DG的聚类中获得的分区及其稳定性得分与之前的评论一致:危机前时期大不相同,两次危机期间的聚类结构相同,现在相关性正在降低,量化宽松正在发挥作用,市场的聚类结构正在变化。DPDSDEDGFig。5:多尺度扰动的稳定性。6:经济体制的稳定性扰动。讨论在本文中,我们提出了一个评估聚类有效性和研究金融时间序列聚类特性的实证框架。这项实证研究可以验证有关金融市场的已知程式化事实。

16
kedemingshi 在职认证  发表于 2022-5-10 11:55:33
在聚类成为交易室的一项技术或经济应用研究的公认工具之前,需要做大量的研究工作。通过这项实验性研究,我们希望能引起聚类界的好奇心,并希望在金融时间序列聚类领域取得进一步进展,使用基于这项研究的框架系统地对所提出的算法进行基准测试,同时考虑到实践者的意愿。参考文献[1]V.Tola、F.Lillo、M.Gallegati和R.N.Mantegna,“投资组合优化的聚类分析”,《经济动力学与控制杂志》,第32卷,第1期,第235-258页,2008年。[2] L.Laloux、P.Cizeau、M.Potters和J.-P.Bouchaud,“随机矩阵理论和金融相关性”,《国际理论与应用金融杂志》,第3卷,第03期,第391-397页,2000年。[3] P.Borysov,J.Hannig和J.Marron,“增长维度层次聚类的渐近性”,《多元分析杂志》,第124卷,第465-479页,2014年。[4] V.Lemieux、P.S.Rahmdel、R.Walker、B.Wong和M.Flood,“聚类技术及其对投资组合形成和风险分析的影响”,发表于宏观建模数据科学国际研讨会论文集。ACM,2014,第1-6页。[5] N.Museci、T.Aste和T.Di Matteo,“金融市场结构与实体经济之间的关系:集群方法之间的比较”,可查阅SSRN 25252912014。[6] J.Sun、C.Falutsos、S.Papadimitriou和P.S.Yu,“Graphscope:大时间演化图的无参数挖掘”,第13届ACM SIGKDD国际知识发现和数据挖掘会议论文集。ACM,2007,第687-696页。[7] C.Tantipathanandh和T.Y.Berger-Wolf,“在动态社交网络中寻找社区”,摘自数据挖掘(ICDM),2011年IEEE第11届国际网络会议。IEEE,2011,第1236-1241页。[8] J.C。

17
能者818 在职认证  发表于 2022-5-10 11:55:37
船体、期权、期货和其他衍生品。培生教育,2006年。[9] D.O\'Kane,单名和多名信用衍生品建模。约翰·威利父子出版社,2011年,第573卷。[10] M.Tumminello、T.Aste、T.Di Matteo和R.N.Mantegna,“复杂系统中过滤信息的工具”,《美国国家科学院院刊》,第102卷,第30期,第10 421-10 426页,2005年。[11] M.Tumminello、F.Lillo和R.N.Mantegna,“金融市场中的相关性、等级和网络”,《经济行为与组织杂志》,第75卷,第1期,第40-58页,2010年。[12] J.Bun,R.Allez,J.-P.Bouchaud和M.Potters,“一般噪声矩阵的旋转不变量估值器”,arXiv预印本arXiv:1502.067362015。[13] B.Efron,“引导法:另一种刀切法”,统计年鉴,第1-26页,1979年。[14] G.Carlsson和F.M’emoli,“分层聚类方法的特征、稳定性和收敛性”,《机器学习研究杂志》,第11卷,1425-1470页,2010年。[15] E.Levine和E.Domany,“聚类有效性无监督估计的重采样方法”,神经计算,第13卷,第11期,第2573–2593页,2001年。[16] S.Ben David、U.Von Luxburg和D.P’al在《学习理论》中发表的《对集群稳定性的清醒审视》。斯普林格,2006年,第5-19页。[17] O.Shamir和N.Tishby,“有限样本的集群稳定性”在NIPS,2007年。[18] T.Di Matteo、F.Pozzi和T.Aste,“利用动态网络检测金融市场部门的层级组织”,欧洲物理期刊B-凝聚态物质和复杂系统,第73卷,第1期,第3-11页,2010年。[19] S.Mayordomo、J.I.Pena和E.S.Schwartz,“所有的信用违约掉期数据库都是平等的吗?”国家经济研究局,技术代表,2010年。[20] G.Marti,P.Very和P。

18
mingdashike22 在职认证  发表于 2022-5-10 11:55:40
Donnat,“面向机器学习随机变量的通用表示”,arXiv预印本XIV:1506.009762015。[21]M.Martens和S.-H.Poon,“国际股票市场之间的收益同步和每日相关性动态”,《银行与金融杂志》,第25卷,第10期,第1805-1827页,2001年。[22]G.Marti,P.Donnat,F.Nielsen和P.Very,“HCMapper:一种用于比较从成对树状图中提取的基于分区的流量聚类的交互式可视化工具”,arXiv预印本arXiv:1507.08137,2015。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 11:50