楼主: 能者818
994 31

[量化金融] 金融市场中基于互信息率的网络 [推广有奖]

21
可人4 在职认证  发表于 2022-5-5 09:59:25
包含所有研究对的距离矩阵D(X,Y)用于确定连接研究集中金融工具的最小生成树和平面最大过滤图[93]。在距离矩阵D的基础上,我们创建一个有序列表S,其中距离按降序列出。然后,为了创建最小跨度树,从列表的第一个元素开始,当且仅当结果图仍然是森林或树时,将相应的链接添加到网络中[94]。类似地,当且仅当生成的图仍然是平面图(亏格等于0)时,可以通过添加相应的链接以相同的方式构造平面最大过滤图。这种构造意味着这些方法从描述所研究复杂系统的特征向量中过滤出重要信息,允许分析人员只关注系统内最重要的信息和相关性,从而有助于理解其行为。相似性度量D定义为基于系统中所有元素对之间的互信息率的度量D矩阵,而不是其他方法中使用的系统相关系数矩阵。根据元素X和Y之间的相似性D(X,Y)的值,将它们按降序排列,从而构建有序列表。在此基础上,可以应用多种过滤工具来创建不同的网络结构,这里,我们首先看一下构造最小生成树(MST)的方法:使用从具有最大相似性度量D的两个元素开始的有序列表,在元素X和元素Y之间的图形中添加一条边,当且仅当插入该边后获得的图形仍然是一个林或树[94]。

22
kedemingshi 在职认证  发表于 2022-5-5 09:59:28
事实上,当使用这种方法时,在添加所有适当链接后获得的图会从之前的图缩减为一棵树[94,95]。与上述构造主题的方法类似,我们也可以构造图,其中唯一的拓扑约束是固定亏格g=k。然后,这些图的构造算法也类似:同样,我们从具有最大相似性的两个元素开始,沿着有序列表S,我们在列表中的这对元素之间添加一个边,当且仅当生成的图仍然可以嵌入到亏格g的曲面上≤ k、 这种嵌入在Genus g=k曲面上的图是一个简单的、无向的连通图,它的拓扑限制性比MST小。事实上,已经证明,这些图总是包含相关的MST,此外,它们还包含与圈和团的结构相关的其他信息,使这些图成为MST的自然扩展。r元素团(r-团)是链接所有r元素的完整子图[94]。当亏格设置为g=0时,生成的图形即为平面[96],即它可以嵌入到球体上。这种图是MST的自然扩展,被称为平面最大过滤图(PMFG)。PMFG和theMST之间的根本区别在于链接的数量:MST只包含n个链接- 1链接,而PMFG包含3(n- 2) 链接。更一般地说,亏格为g=k的图中的链接数最多为3(n)- 2+2k)。PMFG是扩展MST的最简单的图形,除了MST中已经存在的信息外,它只提供最重要的信息。PMFG的拓扑约束意味着它的每个元素必须参与至少一个由三个元素组成的团体。然后,PMFG是球面的拓扑三角剖分[94]。

23
nandehutu2022 在职认证  发表于 2022-5-5 09:59:31
PMFG中只存在三个和四个元素的团,因为Kuratowski定理[96]不允许平面图中元素数量较大的团。较大的团只能出现在亏格g>0的图中。最大允许集团的元素数量随着属的增加而增加[97]。最小生成树为金融工具提供了一种非常具有拓扑限制性的安排,它选择了集合中每个点最相关的连接。因此,从经济学的角度来看,这种层次结构非常有趣,提供了市场中最重要的依赖性,这已在许多研究中得到证明。但是,当MST的结构过于严格时,除了最小生成树之外,文献中提出的其他结构,例如平面最大过滤图[95]可能会很有用,因此我们将使用这两种结构来说明互信息率作为相似性度量的用法。值得注意的是,当上述两种结构不适用于给定的应用程序时,还有其他结构。四、 实证应用应用基于互信息率的网络在实践中,我们对构成华沙证券交易所(WIG20)蓝筹股指数的20种证券中的15种证券进行了对数回报,即在研究期间连续交易的20种证券中的所有证券。数据已从http://bossa.pl/notowania/metastock/,我们研究了2009-2012年的价格。数据以分析价格变动的标准方式进行转换,即数据点是连续每日收盘价之间的对数比率:rt=ln(pt/pt-1) 为了Lempel-Ziv复杂度估计器的目的,这些数据点被离散成4个和10个不同的状态。

24
大多数88 在职认证  发表于 2022-5-5 09:59:35
这些状态代表相等的部分,因此每个状态被分配相同数量的数据点。这种设计意味着模型没有不必要的参数,这可能会影响使用数据时得出的结果和结论。这种和类似的实验装置已用于类似的研究[66,73](Navet&Chen将数据分成8等份),并证明非常有效[66,73,88]。图1。基于相关性的MST–WIG20因此,我们创建了三个最小跨度树:使用基于相关性的距离(见图1)为原始未细分的日志返回,使用基于互信息率的距离(分别见图2和图3)为基数为4和10的字母表离散化日志返回。所有网络中顶点的大小取决于马尔可夫中心性。我们还为相同的实验装置创建了三个平面最大过滤图(见图4、5和6)。选择这样一小组证券是基于较小网络的易读性,因此相关性和基于互信息率的网络之间的变化更直观。尽管如此,我们还计算了每个节点的马尔可夫中心度,以定量地捕捉网络之间的差异。图2。基于MIR(α=4)的MST–图20。3.基于MIR(α=10)的MST–这里我们需要定义马尔可夫中心性。任何网络中最重要的指标之一就是中心性。图中的中心节点通常被视为重要的代理,通过这些代理进行交互(无论是社会交互、经济过程还是生物交互)。中心性是单个节点相对受欢迎程度的良好指标[98]。

25
nandehutu2022 在职认证  发表于 2022-5-5 09:59:38
有很多方法可以量化网络的中心性[99],它们的质量通常是可比较的,因此我们选择马尔可夫中心性,因为它的一般性质。Markovcentrality将网络解释为一个Markov过程,可以直观地理解为令牌在每个节点上执行随机游走的时间量。这可以计算为马尔科夫链中的平均首次通过时间。有关详细说明,请参见[100–102]。表I给出了所研究的最小生成树中节点的马尔可夫中心性,表II给出了所研究的平面最大过滤图的马尔可夫中心性。基于相关性的MST和基于互信息率的MST之间的相关性离散化为FIG。4.基于相关性的PMFG–图20。5.基于MIR(α=4)的PMFG–10个状态等于-分别为0.19和0.22。平面最大过滤图的等效相关性等于- 分别为0.14和0.36。这一点以及由此产生的图形表示表明,这些网络并不包含相同的信息。因此,使用互信息率而不是相关性会改变分析。因为相互的信息。6.基于MIR(α=10)的PMFG–图20。7.基于相关性的MST–NYSE100(颜色在线)图8。基于MIR(α=4)的MST–NYSE100(Coloronline)和互信息率测量了线性和非线性相关性。我们认为,使用这些测量的分析很有趣,应该进行进一步的研究,看看它是否有助于分析其他市场。尽管如此,离散化步骤似乎很重要,垃圾箱数量的选择似乎也很重要。对此没有指导原则,我们只建议上限远低于样本量的平方根,否则选择取决于研究想要研究什么(更多或更少的颗粒价格变化)。

26
可人4 在职认证  发表于 2022-5-5 09:59:42
值得注意的是,在我们的示例中,我们相信字母表基数为4 performsFIG。4.表1.表1.表1.表1.表1.表1.表1.表1.表1.表2.表1.表1.表1.表3.表3.表3.表3.表3.表3.表3.表4.表4.表4.表4.表4.表4.表4.表4.表4.表4.表4.表4.表4.5.10.10.10.10.10.5.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.10.0.041 0.047 0.066SNS 0.052 0.096 0.066TPS0.055 0.049 0.067TVN 0.051 0.024 0.066表二。5.0.055 0 0 0.050 0 0.0 0 0.0 0 0.051 0 0.051 0.051 0.050.0.039 0.039 0.0 0 0 0.038 8 0.0 0 0.0 0 0 0.117 BR0.0 0 0.117 0 0.0 0.117BRS 0.0 0 0.0 0.0 0 0.0.117 7 7.0 0 0.0 0 0 0.0 0 0.0 0 0 0 0 0 0 0 0 0.0.0.0 0.0.3 8 8 8 8 8 8 8 8 8 8 0.0.0 0.0.0.0.117 7 7 7.0.0 0 0 0 0 0 0.117.0.0 0 0 0 0 0.117 7.0 0 0.0.0 0.10 10 10.10 10.10.10.10.10.10.10.10.10.10 10.10.10.10.10.TPS 0.043 0.040 0.052TVN 0.054 0.051 0.065更好。使用Lempel-Ziv复杂度的另一个问题是,它仅渐进地等于互信息率,因此我们不建议对小样本使用这种方法,即基数小于500个数据点的样本(对于日常财务数据,这相当于大约2年)。鉴于三年时间内15只股票的样本在一定程度上限制了分析,尽管有很强的说明力,我们还计算了2003年11月11日至2013年11月7日期间连续测量的91只NYSE100指数股票的样本。基于相关性的MST和基于互信息率的MST之间的相关性分别为0.05和0.01,离散为4和10个状态。平面最大过滤图的等效相关性分别等于0.03和0。使用基于相关性的距离,原始未分类日志返回的结果生成树如图所示。

27
何人来此 在职认证  发表于 2022-5-5 09:59:45
7,对于基数为4和10的字母表的离散化日志返回,使用基于互信息率的距离可以在图上看到。图8和图10。基于相关性的PMFG–NY SE100(颜色在线)图11。PMFG分别基于MIR(α=4)–NYSE100(Coloronline)9。我们还为相同的实验装置创建了三个平面最大过滤图(见图10、11和12)。V.结论在本文中,我们提出了一种利用交互信息的动态扩展来创建研究金融市场的分层网络的方法,称为交互信息率,我们使用多维Lempel-Ziv复杂性来估计交互信息率。我们已将该方法应用于华沙和纽约证券交易所(WIG20和NYSE100)。由此产生的最小生成树和平面最大过滤图与使用皮尔逊相关性作为相似性度量得到的结果有显著差异,因此我们得出结论,皮尔逊相关系数未捕捉到的非线性依赖性和相互信息率捕捉到的非线性依赖性确实与金融市场的层次结构有关。所提出的方法对离散化日志返回的箱子数量的选择非常敏感,并且需要大量样本。应进一步研究基于互信息和互信息率的网络之间的差异,以及分层聚类中这些测度的其他估计器,以及使用信息论方法确定分层聚类中离散对数收益的最佳方法。还应根据其他股票市场、市场指数和货币兑换市场进行进一步研究,以分析这种方法的有用性。图12。基于MIR(α=10)的PMFG b–NYSE100(Coloronline)[1]P.A.Samuelson,I nd。马纳。牧师。

28
大多数88 在职认证  发表于 2022-5-5 09:59:50
6, 41 (1965).[2] B.B.曼德布罗特,J.巴斯。36, 394 (1963).[3] L.P.Kadano Off,《模拟16》(1971)。[4] R.N.Mantegna,Physica A 179232(1991)。[5] A.Jain和R.Dubes,《数据聚类算法》(普伦蒂斯·霍尔,Englewood Cliff,2000)。[6] L.休伯特和F.B.贝克,J.教育。《统计》第187页(1976年)。[7] A.克拉斯科夫、H.圣奥格鲍尔、R.安德泽亚克和P.格拉斯伯格,欧罗波希斯。莱特。70, 278 (2005).[8] M.Tumminello、T.Aste、T.D.Matteo和R.N.Mantegna,欧洲。菲斯。J.B 55209(2007)。[9] R.Mantegna,欧元。菲斯。J.B 11,193(1999年)。[10] L.Laloux,P.Cizeau,J.-P.Bouchaud和M.Potters,Phys。牧师。莱特。83, 1467 (1999).[11] V.Plerou、P.Gopikrishnan、B.Rosenow、L.A.N.Amaral和H.E.Stanley,Phys。牧师。莱特。83, 1471 (1999).[12] G.Akemann,J.Baik和P.D.Francesco,《牛津随机矩阵理论手册》(牛津大学出版社,2011年)。[13] G.博南诺,N.范德维尔和R.N.曼特尼亚,物理系。牧师。E 627615(2000年)。[14] S。马斯洛夫,Physica A 301397(2001)。[15] S。Drozdz,F.Grummer,F.Ruf和J.Speth,PhysicaA 294226(2001)。[16] R.科埃略,C.吉尔摩,B.鲁西,P.里士满,安得州。Hutzler,Physica A 376455(2007)。[17] C.G.吉尔摩、B.M.路西和M.博西亚,《物理》A3876319(2008)。[18] M.Ery igit和R.Eryigit,Physica A 388,3551(2009)。[19] D-M.宋、M.Tumminello、W-X.周和R.N.Mantegna,Phys。牧师。E 84(2011年)。[20] L.Sandoval和I.Franca,Physica A 391187(2012)。[21]M.McDonald、O.Suleman、S.Williams、S.Howison和N.F.Johnson,Phys。牧师。E 72(2005年)。[22]J.-P.Onnela、A.Chakraborti、K.Kaski和J.Kertesz,欧洲。菲斯。J.B 30285(2002年)。[23]J.-P.Onnela,A.Chakraborti,K.Kaski和J.Kertesz,Physica A 324247(2003)。[24]M.Tumminello,T.Aste,T.D.Matteo和R.N.Mantegna,Proc。纳特尔。阿卡德。Sci。《美国法典》10210421(2005)。[25]M.Tumminello、T.Aste、T.D.Matteo和R.N.Mantegna,欧洲。菲斯。J

29
mingdashike22 在职认证  发表于 2022-5-5 09:59:53
B 55209(2007)。[26]M.Tumminello、C.Coronnello、F.Lillo、S.Micciche和R.Mantegna,Int.J.Bifurcat。混沌172319(2007)。[27]谢长廷,J.费南克。46, 1839 (1991).[28]M.Frank和T.Stengos,牧师。经济部。螺柱。56, 553(1989).[29]谢长廷,J.巴士。62, 339 (1989).[30]J.A.舍因克曼和B.勒巴隆,J.巴斯。62, 311(1989).[31]W.A.Brock,D.A.Sheieh和B.LeBaron,非线性动力学,混沌和不稳定性。统计理论和经济证据。(麻省理工学院出版社,剑桥,1991年)。[32]A.Abhyankar,L.Copeland和W.Wong,经济部。J.105864(1995年)。[33]齐先生,J.巴士。经济部。《美国统计》第17卷,第419页(1999年)。[34]D.麦克米兰,内部修订版。经济部。财务部。10, 353 (2001).[35]D.Sornette和J.Andersen,国防部内务部J。菲斯。C 13171(2002年)。[36]K.Oh和K.Kim,专家系统。阿普尔。22, 249 (2002).[37]P.H.Franses和D.V.Dijk,J.Forecasting 15229(1996)。[38]P.陈,种马。非线性Dyn。E.1(1996年)。[39]A.Abhyankar,L.Copeland和W.Wong,J.Bus。经济部。《统计》第15卷第1页(1997年)。[40]P.A.Ammermann和D.M.Patterson,Pac。制动辅助系统。财务部。J.11175(2003年)。[41]R.米斯和A.罗斯,R.埃夫。经济部。螺柱。58, 603 (1991).[42]C.布鲁克斯,澳大利亚。财务部。经济部。6, 307 (1996).[43]祁先生和吴先生,J.Empiri。财务部。10, 623 (2003).[44]T.Cover和J.Thomas,《信息论的要素》(John Wiley&Sons,1991)。[45]F.Zhou,J.He和W.Zhong,在第七届IEEE国际生物信息学和生物工程会议论文集(IEEE,2007)第1051-1055页。[46]周发福、何俊杰、洪文梓和潘耀荣,国际计算机学会。比奥。毒品。2, 187 (2009).[47]A.C.Muller、S.Nowozin和C.H.Lampert,“模式识别”(柏林斯普林格,2012)第二章:使用最小跨度树的信息论聚类。[48]O.Sporns,D。R.Chialvo,M.Kaiser,C.C.Hilgetag,Trends Cogn。Sci。8, 418 (2004).[49]N.Brenner、O.Agam、W.Bialek和R.de Ruyt er Vanstevininck,Phys。牧师。莱特。

30
kedemingshi 在职认证  发表于 2022-5-5 09:59:57
81, 4000 (1998).[50]N.Brenner、O.Agam、W.Bialek和R.de Ruyt er Vanstevininck,Phys。牧师。E 66(2002年)。[51]J.Donges,Y。Zou,N.Marwan和J.Kurths,欧洲。菲斯。J.-规格顶部。174, 157 (2009).[52]M.帕卢斯、V.科马雷克、T.普罗查斯卡、Z.Hrncir和K。Sterbova,IEEE工程医学院。比奥。20, 65 (2001).[53]A.M.弗雷泽和H.L.斯温尼,物理系。牧师。A 331134(1986)。[54]U.Parlitz,“非线性建模——先进的黑盒技术”(Kluwer学术出版社,波士顿,1998)第二章非线性时间序列分析。[55]H.Kantz和T.Schreiber,非线性时间序列分析(剑桥大学出版社,剑桥,2004年)。[56]S。海金,《通信系统》(约翰·威利父子出版社,纽约,2001年)。[57]F.罗西、A.伦达塞、D.弗朗索瓦、V.沃茨和M。Verleysen,化学家。因特尔。实验2,215(2006)。[58]L.Paninski,神经计算机。15, 1191 (2003).[59]C.Floros,S.Ja Offry和G.V.Lima,Stu d.Econ。财务部。24, 220 (2007).[60]S-谢长廷和徐世德,J.亚洲巴士公司。Stu d.4,49(2009)。[61]T.A.A.马纳普和S.H。Kassim,J.风险金融。12,356 (2011).[62]R.Steuer,J.Kurths,C.Daub,J.Weise和J.Selbig,生物信息学18,S231(2002)。[63]A.Papana和D.Kugiumtzis,Int.J.Bifurcat。朝一八四一九七(2009)。[64]C.E.香农,贝尔系统。《技术期刊》27379(1948)。[65]Y.Gao,I.Kontoyiannis和E.Bienenstock,Entropy10,71(2008)。[66]N.Navet和S.-H.Chen,《计算金融中的自然计算》,计算智能研究,第100卷,T.Brabazon and M.编辑。奥尼尔(斯普林格,2008)。[67]A.Lempel和J.Ziv,IEEE T.通知。理论IT-22,75(1976)。[68]J.Amigo和M.Kennel,混沌16,043102(2006)。[69]A.Lesne,J.-L.Blanc和L.Pezard,Phys。牧师。E 79046208(2009年)。[70]J.Amigo、J.Szczepanski、E.Wajnryb和M.SanchezVives,神经计算机。16, 717 (2004).[71]M.Aboy,R.Hornero,D.Abasolo和D.Alvarez,IEEE T.生物医学。英语。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 15:37