楼主: 何人来此
1210 30

[量化金融] gappy时间序列中连通性测度的估计 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-5-8 04:27:40
最终样本包括法国(FCHI)、德国(GDAXI)、荷兰(AEX)、西班牙(IBEX35)和瑞士(SSMI)的股票市场。历史收盘指数价格如图8a所示,其回报率(对数差异)如图8b所示。尽管增加了3004000FCHI(a)40006000GDAXI 200300AEX 80001000012000IBEX35 2009年1月10日1150006000700SSMI-0.0500.050.1FCHI(b)-0.0500.050.1GDAXI-0.0500.050.1AEX-0.0500.050.1IBEX35 Jan09 Jan10 Jan11-0.0500.050.1SMI图8:(a)面板显示的2008年10月13日至2011年9月8日期间5个金融市场的收盘指数。(b) (a)中索引的返回。开始阶段的波动性我们认为五个市场的回报时间序列是相当稳定的,并继续对其进行分析。分析包括对原始时间序列和添加随机间隔的时间序列的互相关、互信息和TE的估计。数据从Finance下载。雅虎。通用域名格式。后者是通过在原始时间序列中插入随机大小(范围从1到5)的间隔块来构建的,从而实现10%和20%的总体缺失值水平。使用MAGR估计的gappy时间序列的互相关和互信息非常接近在原始时间序列上获得的相应值,如图9所示。对于图中的每个面板。

22
nandehutu2022 在职认证  发表于 2022-5-8 04:27:44
9,左上角FCHI GDAXI AEX IBEX35 SSMIFCHIGDAxiAxiAEX35SSMI(a)XXXXX 0.80.820.840.860.880.90.920.94FCHI GDAXI AEX IBEX35 SSMIFCHIGDAxiAxiAEX35SSMI(b)XXXXX 0.80.820.840.860.880.90.920.94FCHI GDAxiAxiAEX IBEX35 SSMI(c)XXXXX 0.20.250.30.350.45FCHI GDAxiAxiAxiAxiAxiAxiAEX IBEX35 SS45SS40.90.90.90灰色地图比例尺右下三角部分的六个财务指标和左上三角部分的gappy时间序列(使用MAGR)的原始时间序列的相关性度量。(a) 互相关和10%差距,(b)互相关和20%差距,(c)互信息和10%差距,(d)互信息和20%差距。gappy时间序列的三角形部分与原始时间序列右下三角形部分的Symmetricell具有相同的灰度颜色,这表明在对原始时间序列和gappy时间序列进行计算时,每对财务指标的相关度量值大致相同。当间隙百分比为20%时,可以观察到的唯一轻微偏差是交叉互信息(参见图9d中的GDAXI-IBEX35对)。因此,即使缺失了大量的值,也可以可靠地估计财务状况之间的相关性。结果表明,AEX、FCHI和GDAXI之间的相关性强于IBEX35和SSMI。值得注意的是,尽管差距时间序列的长度从约735缩短至640(10%的差距),从490缩短至20%(取决于财务指数),但就插入的差距而言,相关度量的估计是稳定的。

23
何人来此 在职认证  发表于 2022-5-8 04:27:47
事实上,对于GDAXI-IBEX35这对组合,交叉互信息间隙在20%的间隙(从0.265到0.293)中的值要大得多,间隙时间序列的长度最小,为474。关于转移熵,其在使用MAGRdeviate的gappy时间序列上的值比原始财务时间序列上的值更大,如图10所示。添加10%FCHI GDAXI AEX IBEX35 SSMIFCHI GDAXI AEX IBEX35 SSMIFCHI GDAXI AEX IBEX35 SSMIFCHI GDAXI AEX IBEX35 SSMIFCHI Gdaxiaex IBEX35 SSMIFCHIGDAXIAEXIBEX35SSMI(c)XXXXX 00.050.10.150.2图10:六个财务指标的转移熵灰度图:(a)原始时间序列,(b)有10%差距的时间序列,以及(c)有20%差距的时间序列。驱动效应是从行到列的。差距不会显著改变TE的估计值,尽管TE值有微小变化,但因果关系的整体模式基本上保持不变。尽管如此,没有系统性偏差,偏差是随机的正偏差和负偏差。在20%的情况下,因果关系的原始模式保持得相对较好,但在彩色地图中,也就是说,对比图10a和图10c,存在显著差异。尽管方差随着间隙百分比的增加而增加,但没有偏差,TE值降低,例如从FCHI到IBEX35,并以随机方式增加,例如从SSMIto AEX。TE估计中的差距百分比方差比相关估计中的差距百分比方差大20%的原因是TE对数据的要求更高。事实上,对于这里使用的最简单的TE设置(m=1,τ=1),数据点的有效数量仅略小于相关度量,具体而言,原始时间序列的数据点数量约为725,根据财务指数,差距为10%时减少到620,差距为20%时减少到460。6.

24
能者818 在职认证  发表于 2022-5-8 04:27:51
讨论在计算连通性度量时,我们提出了一种处理多元时间序列间隙的简单方法,如互相关、互相关信息和传递熵。所考虑的连接性度量假设一个连接数据矩阵,其中的行是按时间顺序排列的,每一行都视为一个当前向量,并且可能是这两个变量的过去和未来观测值。其思想是将包含空条目的行(对应于缺少的值)限制在一起,并在缩减行的矩阵上进行计算。这种被称为测量适应间隙消除(MAGR)的方法的重要优点是,(可能的)耦合系统的动力学是完整的,这与所有的间隙填充方法不同,在随机或确定性模型下替换了底层动力学的间隙。当然,任何假设模型都不可能适用于所有问题。我们对线性和非线性耦合系统的模拟揭示了间隙填充方法的不足(我们考虑了线性、三次、样条、最近邻和随机插值),并证实了MAGR在估计具有间隙的二元时间序列中的连通性度量时的适当性。MAGR的一个明显缺点是,用于计算连通性度量的可用数据量的减少程度取决于间隙的数量g以及间隙的类型(同一个g可以考虑许多单个缺失值或称为块间隙的几组连续缺失值),以及连通性度量的参数,例如,转移熵测度中的嵌入维数m。因此,在涉及(比如)较大G和m的环境中使用MAGR,可能没有足够的数据点来计算连通性度量,并且估计值可能具有较大的方差。

25
大多数88 在职认证  发表于 2022-5-8 04:27:54
实际上,这相当于有一个等间距非间隙时间序列,模拟结果确实表明,在MAGR处理的间隙时间序列和等间距非间隙时间序列上,连通性度量的两个估计值很好地匹配。模拟显示,MAGR对gappy和非gappy时间序列估计的平均连接性度量没有偏差,与g无关,但估计可能有更大的方差(由可用数据量暗示),而间隙填充方法的偏差随g增加而增加。gapclosure方法的性能最差,这实际上是基于独立观测的最有力的,通常也是最无效的假设。

26
可人4 在职认证  发表于 2022-5-8 04:27:57
因此,对于具有许多间隙的时间序列,使用间隙填充方法对连接性度量的估计将倾向于偏离,而使用MAGR,它将处于对缩短长度的时间序列的估计水平。我们还发现,当相同数量的间隙出现在固定大小或不同大小的块中时,间隙填充方法的性能没有差异,但随机插值除外,它随着块间隙的大小而改善。另一方面,对于MAGR,估计值同样匹配良好,但现在随着联合数据矩阵中空条目行的减少,方差减小。后者不考虑仅涉及联合数据矩阵行中当前值的度量,例如零滞后互相关和互信息,对于这些度量,MAGR中的数据缩减对于单个和块间隙是相同的。上述发现表明,根据连接测量估计值对时间序列长度的敏感性,不应使用间隙填充法或MAGR直接比较相同长度但间隙量不同的不同双变量时间序列的估计值。使用MAGR,比较应基于具有相同大小的非空条目的联合数据矩阵。在多变量时间序列记录加窗的许多应用中,可能会出现大小和频率不规则的缺口,例如在分析多通道脑电图(EEG)或金融市场指数时,可以满足这种情况。然而,我们对一组六个金融市场指数的示范性研究表明,即使时间序列中存在重大差距,MAGR也可以提供可靠的相关性和因果关系度量估计。

27
何人来此 在职认证  发表于 2022-5-8 04:28:01
除了转移熵估计中随差距百分比增加的影响外,还可以可靠地估计每个pairof指数的因果关系。然而,值得注意的是,这些结果是通过简单的传递熵设置得到的,增加嵌入维度将导致有效数据量的大幅减少,使用MAGRand,随后在传递熵估计中使用更大的方差。然而,从模拟和财务应用中获得的证据表明,对于小百分比的差距或大时间序列,MAGR是获得可靠的互相关和格兰杰因果关系估计的合适方法。在这项工作中,我们在一些二元连接性测度上演示了MAGR方法。尽管MAGR是特定的度量值,必须适应所选的度量值,但将其适应以联合数据矩阵为核心的任何度量值都很简单,该矩阵包含了多元时间序列上的大多数度量值。例如,MAGR可以直接应用于部分转移熵,调节反应对其他观察变量的影响[28,22]。简单地说,联合数据矩阵被展开,包含其他观察变量的列。当然,如果其他变量的时间序列中存在异步间隙,矩阵的大小将进一步减小,从而影响度量估计的稳定性。使用多变量因果关系度量的系统分析是即将进行的一项研究的主题。MAGR还可以应用于单变量和多变量时间序列的模型,因为它们也依赖于联合数据矩阵。

28
何人来此 在职认证  发表于 2022-5-8 04:28:04
例如,对于一元自回归模型,滞后变量矩阵具有联合数据矩阵的作用,在消除空条目行后,可以应用普通最小二乘法计算模型参数。多元自回归模型的扩展很简单。参考文献[1]Bahadori,M.T.,Liu,Y.,2012。不规则时间序列中的因果关系分析。参加:暹罗国际数据挖掘会议。第660-671页。[2] 布雷斯勒,S.L.,塞思,英国,2011年。维纳-格兰杰因果关系:一种成熟的方法学。神经影像58323–329。[3] 布罗森,P.,2009年。使用时间序列模型对不规则采样数据进行频谱分析的实践方面。仪器和测量,IEEE交易,第58(5)页,1380–1388页。[4] 塞卢奇,C.J.,阿尔巴诺,A.M.,拉普,P.E.,2005年。互信息计算的统计验证:替代数值算法的比较。体检E 71,066208。[5] Cover,T.,托马斯,J.,1991年。信息论的要素。约翰·威利·安德森,纽约。[6] 达豪斯,R.,库尔斯,J.,马斯,P.,蒂默,J.(编辑),2008年。时间序列分析和数字图像处理中的数学方法。Springer Verlag,柏林/海德堡。[7] Dergachev,V.A.,Gorban,A.N.,Rossiev,A.A.,Karimova,L.M.,Kuandykov,E.B.,Makarenko,N.G.,Steier,P.,2001年。通过人工神经网络填补地球物理时间序列中的空白。放射性碳43(2A,第1部分),365–371,第17届国际放射性碳会议,以色列耶路撒冷。[8] Elshorbagy,A.,西蒙诺维奇,S.P.,美国帕努,2002年。利用混沌理论原理估计缺失的水流数据。水文学杂志255123–133。[9] 法基尼,A.,莫肯尼,C.,2011年。通过双胞胎替代物填补生态时间序列中的空白。《分叉与混沌国际杂志》21(4),1085-1097。[10] 哈维,A。

29
大多数88 在职认证  发表于 2022-5-8 04:28:07
C.,皮尔斯,R.G.,1984年。估计经济时间序列中的缺失观测值。《美国统计协会杂志》79(385),125–131。[11] 赫拉夫·阿奇科夫·辛德勒,K.,马州帕卢什,马州维梅尔卡,J.巴塔查里亚,2007年。基于时间序列分析中信息论方法的因果关系检测。物理报告441(1),1-46。[12] 霍克,K.,坎普费尔,N.,2009年。通过Lomb Scargle周期图对不均匀采样数据进行间隙填充和降噪。大气化学与物理学94197–4206。[13] 康德拉肖夫,D.,马里兰州吉尔,2006年。地球物理数据集中缺失点的时空填充。地球物理学中的非线性过程13,151–159。[14] 康德拉肖夫,D.,纽约州希普利斯,密歇根州吉尔,2010年。通过奇异谱分析填补太阳风数据空白。地球物理研究通讯37L15101。[15] 克林德勒医学博士,哥伦比亚特区卢姆登,2006年。时间序列分析中不规则样本和缺失数据的影响。非线性动力学、心理学和生命科学10(2),187–214。[16] 库尔曼,L.,克特伊斯,J.,卡斯基,K.,2002年。不同股票回报之间的时间依赖性互相关:一个直接的影响网络。物理评论66026125。[17] 库普,C.W.,特蕾西,E.R.,2009年。转移熵在gappytime级数中的应用。物理字母A 373(14),1261-1267。[18] 曼赞,S.,迪克斯,C.,2002年。基于相关积分的串行独立性和线性测试。非线性动力学和计量经济学研究6(2),1005。[19] Musial,J.P.,Verstraete,M.M.,北卡罗来纳州戈布朗,2011年。比较最新算法对填充和平滑不完整和噪声时间序列的效果。大气化学和物理讨论11(5),14259-14308。[20] 帕帕纳,A.,库吉乌姆齐斯,D.,2009年。时间序列互信息估计器的评估。

30
何人来此 在职认证  发表于 2022-5-8 04:28:10
《国际分岔与混沌杂志》19(12),4197–4215。[21]Papana,A.,Kugiumtzis,D.,拉尔森,P.G.,2011年。减少因果测量的偏差。体检E 83036207。[22]Papana,A.,Kugiumtzis,D.,Larsson,P.G.,2012年。直接因果效应的检测及其在癫痫患者脑电图分析中的应用。国际分歧与混沌杂志22(9),1250222。[23]帕帕纳,A.,凯尔特苏,C.,库吉乌姆齐斯,D.,迪克斯,C.,2013年。多元时间序列中直接因果关系测度的模拟研究。熵15(7),2635-2661。[24]帕帕雷拉,F.,2005年。填补混沌时间序列中的空白。物理字母A 346(13),47-53。[25]基安·基罗加,R.,阿恩霍尔德,J.,莱纳茨,K.,格拉斯伯格,P.,2000年。KulbackLeibler和重整化熵:癫痫患者脑电图的应用。物理回顾E 62(6),8380-8386。[26]Schreiber,T.,2000年。测量信息传递。体检单85(2),461-464。[27]Ustoorikar,K.,Deo,M.,2008年。用基因编程填补波浪数据的空白。海洋结构21(2-3),177-195。[28]Vakorin,V.A.,Krakovska,O.A.,麦金托什,A.R.,2009年。直接联系对因果关系估计的混淆影响。神经科学方法杂志184152-160。[29]美国沃加,1992年。债券收益率、流动性和缺失数据。《金融与定量分析杂志》27(4),605–617。[30]Wehling,S.,Simion,C.,Shimojo,S.,Bhattacharya,J.,2008年。通过部分定向相干评估多元时间序列的连通性模式。作者:Allefeld,C.,beim Graben,P.,Kurths,J.(编辑),《电生理信号分析和符号基础的高级方法:语言的动力系统方法》。NOVA出版社,第17章,第275-295页。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 06:36