楼主: 能者818
1443 27

[量化金融] 变时间尺度下相关性的最小生成树滤波 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.6240
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-5-26 20:55:36 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Minimum spanning tree filtering of correlations for varying time scales
  and size of fluctuations》
---
作者:
Jaroslaw Kwapien, Pawel Oswiecimka, Marcin Forczek, Stanislaw Drozdz
---
最新提交年份:
2017
---
英文摘要:
  Based on a recently proposed $q$-dependent detrended cross-correlation coefficient $\\rho_q$, we generalize the concept of minimum spanning tree (MST) by introducing a family of $q$-dependent minimum spanning trees ($q$MST) that are selective to cross-correlations between different fluctuation amplitudes and different time scales. They inherit this ability directly from the coefficients $\\rho_q$ that are processed here to construct a distance matrix. Conventional MST with detrending corresponds in this context to $q=2$. We apply the $q$MSTs to sample empirical data from the stock market and discuss the results. We show that the $q$MST graphs can complement $\\rho_q$ in disentangling correlations that cannot be observed by the MST graphs based on $\\rho_{\\rm DCCA}$ and, therefore, they can be useful in many areas where the multivariate cross-correlations are of interest. We apply our method to data from the stock market and obtain more information about correlation structure of the data than by using $q=2$ only. We show that two sets of signals that differ from each other statistically can give comparable trees for $q=2$, while only by using the trees for $q \\ne 2$ we become able to distinguish between these sets. We also show that a family of $q$MSTs for a range of $q$ express the diversity of correlations in a manner resembling the multifractal analysis, where one computes a spectrum of the generalized fractal dimensions, the generalized Hurst exponents, or the multifractal singularity spectra: the more diverse the correlations are, the more variable the tree topology is for different $q$s. Our analysis exhibits that the stocks belonging to the same or similar industrial sectors are correlated via the fluctuations of moderate amplitudes, while the largest fluctuations often happen to synchronize in those stocks that do not necessarily belong to the same industry.
---
中文摘要:
基于最近提出的$q$依赖的去趋势互相关系数$\\rho\\u q$,我们通过引入一系列的$q$依赖的最小生成树($q$MST)来推广最小生成树(MST)的概念,这些树对不同波动幅度和不同时间尺度之间的互相关具有选择性。它们直接从这里处理的系数$\\rho\\u q$继承此能力,以构造距离矩阵。在这种情况下,带有detrending的传统MST对应于$q=2$。我们应用$q$MST从股票市场中抽取实证数据,并对结果进行讨论。我们表明,$q$MST图可以补充$\\rho\\u q$在基于$\\rho\\u{\\ rm DCCA}$的MST图无法观察到的分离相关性,因此,它们可以在多变量互相关感兴趣的许多领域中使用。我们将我们的方法应用于股票市场的数据,并获得了有关数据相关性结构的更多信息,而不是仅使用$q=2$。我们表明,统计上彼此不同的两组信号可以给出$q=2$的可比树,而只有使用$q=2$的树,我们才能区分这些组。我们还表明,一系列$q$MST(范围为$q$)以类似多重分形分析的方式表示相关性的多样性,其中计算广义分形维数、广义赫斯特指数或多重分形奇点谱:相关性的多样性越大,对于不同的q$s,树拓扑的变量越大。我们的分析表明,属于相同或类似工业部门的股票通过中等幅度的波动相互关联,而最大的波动往往发生在不一定属于同一行业的股票中。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--

---
PDF下载:
--> Minimum_spanning_tree_filtering_of_correlations_for_varying_time_scales_and_size.pdf (2.27 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:最小生成树 相关性 correlations Fluctuations Multifractal

沙发
能者818 在职认证  发表于 2022-5-26 20:55:43
最小生成树过滤不同时间尺度和大小的流体的相关性Jaroslaw Kwapień、PawelO'swiecimka、Marcin Forczek和Stanislaw Drozdz1,2波兰科学院核物理研究所,克拉科夫克拉科夫理工大学波兰物理、数学和计算机科学学院,波兰(日期:2017年5月5日),基于最近提出的q相关去趋势互相关系数ρq(J.Kwapień,P.O'swiecimka,S.Drozdz,Phys.Rev.E 92,052815(2015)),我们通过引入一系列q相关最小生成树(qMST)来推广最小生成树(MST)的概念,这些树对多元数据的不同波动幅度和不同时间尺度之间的交叉相关性具有选择性。他们直接从系数ρq继承了这一能力,系数ρq在这里被处理以构造距离矩阵,作为MST构造Kruskal算法的输入。在这种情况下,具有去趋势的常规MST对应于q=2。为了说明他们的表现,我们运用qMSTs从美国股市中抽取实证数据,并对结果进行讨论。我们表明,qMST图可以补充ρqin,从而消除基于ρdccaa的MST图无法观察到的“隐藏”相关性,因此,它们可以在多变量互相关感兴趣的许多领域中使用。作为一个例子,我们将此方法应用于股票市场的经验数据,并表明通过构建q值谱的QMST,我们获得了有关数据相关结构的更多信息,而不是仅使用q=2。更具体地说,我们表明,统计上彼此不同的两组信号可以给出q=2的可比树,而只有使用q 6=2的树,我们才能区分这些组。

藤椅
何人来此 在职认证  发表于 2022-5-26 20:55:46
我们还表明,q范围内的qmst家族以类似多重分形分析的方式表达相关性的多样性,其中计算广义分形维数、广义Hurst指数或多重分形奇点谱的谱:相关性越多样,不同qs的树顶学越可变。关于股票市场的关联结构,我们的分析表明,属于相同或类似行业的股票通过中等幅度的波动进行关联,而最大的波动往往与不一定属于同一行业的股票同步。PACS编号:89.75-k、 89.75。Da,89.65。Gh,02.70。RrI。简介最小生成树(MST)是一个加权网络的子图,它在生成网络时最小化边长度之和,且不包含任何圈。在优化和多变量数据分析中,如果相应的completenetwork不能以透明的方式显示,则通常使用它来可视化网络的关键属性或数据的表示。MST应用的许多示例可以在文献中找到(参见,例如,[1-5]),但它们在经济物理学中尤其常见[3,6-31]。通常,网络分析用于描述同时测量的多个观测值之间的相关结构。这些可观测项由节点表示,相关性由加权边表示。这些权重可以用任何相关度量来表示,例如皮尔逊系数或互信息。如果权重已转换为欧几里德距离,则可以使用Kruskal算法或Prim算法构建最小跨度树。在处理经验数据时出现的关键问题之一是如何克服非平稳性。

板凳
nandehutu2022 在职认证  发表于 2022-5-26 20:55:49
与前面提到的方法一样,标准相关性方法很容易因数据的大波动而导致不稳定[34],因此使用此类方法获得的结果并不完全可靠。不可避免地,同样的弱点也会被建立在这些措施基础上的网络所继承。然而,由于非平稳性通常与趋势相关,在不同尺度上同时进行趋势分析可以产生平稳数据。去趋势波动分析(DFA)是这方面最常用的方法【35】。其结果是一个波动函数,对非平稳信号起方差作用。类似地,协方差的作用由去趋势互相关分析(DCCA)的结果显示出来【36】。基于这两种方法,引入了所谓的去趋势互相关系数ρdcca,它是皮尔逊相关系数的一部分【37】。它可用于非平稳数据的分类中,以量化给定时间尺度下n个去趋势信号之间的交叉相关性强度【37–42】。在统计分析中,方差和方差可以为给定数据集的概率分布函数提供完整的描述,而要做到这一点,需要整个统计矩族。皮尔逊相关系数对数据之间的任何非线性依赖关系都不敏感。同样,DFA和DCCA用于检测幂律自相关和交叉相关以及信号的相关分形特性,但不可能使用它们来检测比单分形更复杂的非线性结构。因此,与简单的去趋势协方差相比,去趋势互相关系数ρDCCAalso在检测高阶统计量方面的能力有限。

报纸
大多数88 在职认证  发表于 2022-5-26 20:55:52
为了使它更有效,最近我们提出了它的推广,称为q依赖的去趋势交叉相关系数ρq(q∈ R) [43]。其主要目的是通过放大特定尺寸的相关函数,同时抑制其他尺寸的相关函数,选择性地识别与振幅相关的互相关。ρqcoe系数基于DFA和DCCA的多尺度推广,即多重分形去趋势函数分析(MFDFA)[44]和多重分形去趋势互相关分析(MFCCA)[45]。这两种方法原则上都适用于量化一个或两个信号中的多重分形结构,但它们对时间尺度的敏感性使得它们也可用于描述非分形信号。可以直接利用ρdccaco系数和皮尔逊系数之间的类比来构造去趋势最小生成树[29]。与标准MST相比,它们的主要优势在于,由于独立于数据的非平稳性,它们在时间方面更加稳定。在我们目前的工作中,我们希望将去趋势最小生成树的这一特性与ρqt关注特定大小的函数的能力结合起来。作为一个结果,我们得到了一个不仅能够在时间尺度上,而且能够在flucturationsize上,对多变量非平稳信号的相关结构进行量化的atool。与ρDCCA的情况一样,所研究的信号可能是任意的,因为不需要分形性质。我们的论文组织如下。在第二节中,我们提供了必要的定义;在第三节中,我们描述了经验数据,并根据这些数据展示了qMST分析的结果;在第四节中,我们收集了主要结论。二、方法让我们从MFCCA方法的简要描述开始[45]。

地板
何人来此 在职认证  发表于 2022-5-26 20:55:56
考虑一对时间序列x(i)i=1,。。。,Tand y(i)i=1,。。。,t分成2个长度为s的盒子(即从两端开始的盒子)。在每个框中,ν(ν=0,…,2Ms- 1) ,我们计算积分信号与这些信号对应的mth或der多项式P(m)之间的差值:Xν(s,i)=iXj=1x(νs+j)- P(m)X,s,ν(j),(1)Yν(s,i)=iXj=1y(νs+j)- P(m)Y,s,ν(j),(2),其中m通常为2。框ν中X和Y的协方差和方差定义为:fXY(s,ν)=ssXi=1Xν(s,i)Yν(s,i),(3)fZZ(s,ν)=ssXi=1Zν(s,i)。(4) 这里Z可以是X或Y。现在,我们定义了一系列q阶函数[44,45]:FqXY(s)=2Ms2Ms-1Xν=0符号fXY(s,ν)|fXY(s,ν)| q/2,(5)FqZZ(s)=2Ms2Ms-1Xν=0fZZ(s,ν)问题2。(6) signum函数输入FqXY(s)的表达式,以保留协方差fXY(s,ν)的符号,否则这些符号将在模数中丢失,这对于确保FqXY(s)的实值是必要的。通过放大或抑制盒内方差和协方差,实参数q起到了滤波器的作用>> 2只有具有最高流动性的方框(尺寸为s)才对总量有实质性贡献,而对于Q<< 2只有具有最小摩擦力的盒子才可以。q=2的特殊情况允许我们将上述公式简化为:FXY(s)=2Ms2Ms-1Xν=0fXY(s,ν),(7)FZZ(s)=2Ms2Ms-1Xν=0fZZ(s,ν),(8),其中所有框贡献具有相同权重的和。[FqXY(s)]1/qand[FqZZ(s)]1/qc的尺度依赖性可以表明信号的分形特征,如果它是幂律的,但这里我们考虑了这种依赖性的任何形式。依赖于q的去趋势互相关系数ρq(s)是通过qth阶函数定义的【43】:ρq(s)=FqXY(s)pFqXX(s)FqY Y(s)。(9) 对于q=2,等式。

7
可人4 在职认证  发表于 2022-5-26 20:55:59
(9) 降低到ρDCCA的定义[37]。ρq(s)的过滤能力表现为:q=2的值与指数q的偏差越大,相应方框中的函数对系数ρq(s)的贡献越大。Forq公司≥ 0,范围e内的ρq fit值- 1.≤ ρq≤ 1.(10)与皮尔逊系数和ρDCCAcoe系数一样,ρq=1表示完全相关,ρq=0表示独立信号,ρq=-1表示完全反相关。然而,当q<0时,系数ρqis不受独立或弱相关信号的限制,可能会发生ρq>1的情况。在这种情况下,需要考虑ρqis的反向值,该值将系数映射回[-1,1]区间[4 3]。在N个平行信号的多元分析中,必须处理N(N- 1) /2每个考虑框大小(时间尺度)s的不同系数ρqf。因此,将它们放入大小为N×N的矩阵中很方便,可以将其视为定义N个节点加权网络的矩阵。与皮尔逊相关系数类似,ρqis不是无量纲的,因为它不能填补三角形不等式。在最小生成树构造的标准过程中,相关系数矩阵根据以下公式转换为(公制)距离矩阵:dXY=p2(1- cXY),其中cXY是为信号X和Y计算的皮尔逊系数【3】。然而,使用ρq,d(q)XY=q2(1)的类似变换- ρ(XY)q),(11)通常可能不会产生度量值。为了数值测试三角形不等式:d(q)XY(s)+d(q)Y Z(s)≥ d(q)XZ(s)对信号X,Y,Z的任何三个有效,我们生成一组长度为T=10的N=100信号,即自回归分馏移动平均(ARFIMA)过程[46]。

8
何人来此 在职认证  发表于 2022-5-26 20:56:03
接下来,对于agiven s和q,我们计算每对sig nals(总共4950对)的ρqf,并将其值转换为距离d(q)XY。然后,对所有可能的耐受三元组(总共161700个)检验不等式,并计算e例外。对于不同的q值,重复相同的步骤序列(-1 0≤ q≤ 10). s和q的样本值结果收集在选项卡中。一、 对于q≥ 距离总是充满了不等式,这意味着d(q)xy的行为就像一个度量。然而,对于q≤ 0出现异常,表明距离不能被视为度量。我们还对股票市场的随机经验数据(100家最大的美国公司的对数价格波动,第三节将研究的相同数据集)进行了相同的测试,并发现质量上类似的结果:没有违反q≥ 1和频繁违反forq≤ 因此,我们的进一步分析将被限制为正q。然而,这并不限制我们方法的稳健性,因为在许多经验系统中,由q负值选择的小函数与噪声相关。现在,我们准备使用等式(11)给出的q距离定义一个q相关的最小生成树。qMST可以通过将Kruskal算法应用于d(q)XY来构造。该算法由两个基本步骤组成:(1)将距离矩阵的元素从最小到最大;(2)从最小距离s开始,将尚未连接的节点连接到最接近的节点。

9
大多数88 在职认证  发表于 2022-5-26 20:56:06
连接所有节点后,生成的树由N个节点和N个-1加权边。sq-4.0-3.0-2.0-1.0 0 0.0 1.0 2.0 3.0 4.020 0 3 2626 0 27 0 0 0 0 0200 2 1984 80 0 0 0 0 0 0 0 0 02000 0 49 2160 5162 0 0 0 0 0 0 0 0 020000 52 252 1955 9089 0 0 0 0。经过优化,所有距离d(q)xy之和尽可能小。qMSTs继承了ρq的属性,因此通过选择q的一个特定值,关系树只表示在一个有限大小的函数中存在的那些相关性:q的大相关性>> 2和q<2的小值。然而,尽管对于q=2,这种构造去趋势最小生成树的过程对所有波动幅度赋予了相同的权重,但必须记住,即使对于q的这个值,它也与不涉及去趋势的标准过程有很大不同。三、 qMST对于经验数据为了展示qMST分析的示例,我们考虑一组表示对数股票价格波动(回报)的时间序列:rX(t,t) )=ln pX(t+t)- ln pX(t)(12)为1998年至1999年纽约证券交易所交易的N=100家最大的美国公司[47]。我们选择的采样间隔为t=1分钟,以获得足够长的时间序列(t=203,190)。我们计算所有可能的股票对的ρq(s),几个不同的时间尺度s:20分钟、60分钟、390分钟(一个交易日)、1950分钟(一个交易周)和7800分钟(约。

10
大多数88 在职认证  发表于 2022-5-26 20:56:10
一个交易月),以及从q=1.0到q=6.0的一些不同Qf值(虽然我们只使用整数值,但也可以使用任意正实值)。接下来,我们推导度量距离d(q)XY(s),并应用Kruskal算法获得s和q的每个值的最小跨度树(总共36棵树)。图1显示了最短时间刻度=20和样本指数q=5.0的qMST。不同的工业部门和子部门分别通过不同的颜色和同色阴影进行区分,节点符号的大小与相应公司的市场资本化程度成比例。计算的ρ(XY)q越高,连接节点X andY的边越厚。可以看出,树拓扑介于集中式网络和分布式网络之间。有度高达k=9的集线器和许多k=1的外围节点,但最短路径长度较高:L≈ 7.9。边缘权重也是ratherFIG。1: (在线上色)q-depen dent minimum spanningtree示例(s=20,q=5.0)。1999年12月31日,符号大小与股票市值成比例,而不同的部门用不同的颜色表示,同一部门内的不同吸光度用特定的颜色表示:技术(从浅红色到深棕色)、服务(从浅蓝色到深蓝色)、能源(从浅品红到深品红),金融(从浅绿色到深绿色和橄榄色)、消费者非周期性(从青色到绿松石色)、基本材料(从黄色到绿黄色)、医疗保健(橙色和浅棕色)、消费者周期性(紫色)、资本品(海绿)、公用事业(紫罗兰色)和企业集团(白色)。边缘厚度与ρq成正比(厚度越高,股票的相关性越大)。尽可能细的线表示的边数较小。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-14 08:31