楼主: 何人来此
1206 30

[量化金融] gappy时间序列中连通性测度的估计 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-8 04:26:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Estimation of connectivity measures in gappy time series》
---
作者:
G. Papadopoulos and D. Kugiumtzis
---
最新提交年份:
2015
---
英文摘要:
  A new method is proposed to compute connectivity measures on multivariate time series with gaps. Rather than removing or filling the gaps, the rows of the joint data matrix containing empty entries are removed and the calculations are done on the remainder matrix. The method, called measure adapted gap removal (MAGR), can be applied to any connectivity measure that uses a joint data matrix, such as cross correlation, cross mutual information and transfer entropy. MAGR is favorably compared using these three measures to a number of known gap-filling techniques, as well as the gap closure. The superiority of MAGR is illustrated on time series from synthetic systems and financial time series.
---
中文摘要:
提出了一种计算多变量有间隙时间序列连通性测度的新方法。不删除或填充间隙,而是删除包含空条目的联合数据矩阵的行,并在余数矩阵上进行计算。该方法称为测量自适应间隙去除(MAGR),可应用于任何使用联合数据矩阵的连通性度量,如互相关、互信息和传递熵。与许多已知的间隙填充技术以及间隙闭合相比,使用这三种测量方法,MAGR更为有利。从综合系统的时间序列和金融时间序列的角度说明了MAGR的优越性。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
--> Estimation_of_connectivity_measures_in_gappy_time_series.pdf (256.76 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:时间序列 Gap App Multivariate connectivity

沙发
何人来此 在职认证  发表于 2022-5-8 04:26:38
gappy时间序列中连通性度量的估计。帕帕佐普洛萨,D.库吉乌姆齐斯巴,科莫蒂尼色雷斯德谟克利特大学经济系,希腊萨洛尼基亚里士多德大学工程学院电气和计算机工程系,希腊萨洛尼基塞萨洛尼基54124提出了一种新方法来计算多变量有间隙时间序列的连通性测度。不删除或填补空白,而是删除包含空条目的联合数据矩阵行,并在剩余矩阵上进行计算。该方法称为测量自适应间隙消除(MAGR),可应用于任何使用联合数据矩阵的连通性度量,如互相关、互信息和传递熵。MAGR将这三种方法与许多已知的间隙填充技术以及间隙闭合进行了比较。从综合系统和金融时间序列的时间序列上说明了MAGR的优越性。关键词:多元时间序列分析,连通性度量,时间序列中的差距,转移熵:89.70。比照,05.45。Tp1。引言在多变量时间序列分析中,主要关注的是观察变量之间的相互作用。为此,在不同的条件下提出了许多措施,如相互依赖、耦合、格兰杰因果关系和连通性。这些度量有一定的区别,如相关性和因果性度量、线性和非线性度量,以及时域和频域上的度量[11,6,2,23]。

藤椅
kedemingshi 在职认证  发表于 2022-5-8 04:26:41
我们在研究中使用的此类度量的示例包括互相关和互信息的相关度量,以及转移熵的因果度量[26]。所有这些方法都是在假设被分析的时间序列是均匀分布的情况下发展起来的,这意味着测量是在固定的采样点上进行的。然而,情况并非总是如此,在许多应用中,时间序列都有间隙,如在环境科学中(间隙的出现是地球物理[13,7,8]、生态学[9]和海洋学[27]时间序列、天文学[14]和社会经济学[10,29]的常见问题)。以不规则或不均匀的时间间隔对邮件地址进行采样:dkugiu@gen.auth.gr(D.Kugiumtzis)2015年5月4日提交给Physica A的预印本不同类别的问题,此处未对其进行研究,例如,光谱估计见[3,12],格兰杰因果关系见[1]。对于gappy时间序列,所有拟议技术的常用方法是首先以某种方式填补空白,然后将选择的方法应用于新的均匀空间时间序列。这些技术包括相对简单的技术,如连接间隙边缘的“间隙闭合”、三次样条和k近邻插值、更复杂的技术,如单谱分析(SSA)[13],神经网络[7],以及混沌假设下的状态空间重构[24],等等。这些方法在不同的实际应用中的比较见[8,15,19]。对于二元和多元时间序列,SSA和神经网络等方法可以扩展到包含所有时间序列的信息,以恢复间隙[13],以及其他利用非线性动力学和替代数据概念的最新方法[9]。

板凳
何人来此 在职认证  发表于 2022-5-8 04:26:45
特别是对于转移熵的应用,Kulp和Tracy[17]研究了一种称为“随机替换”的随机间隙填充技术,该技术用于谐波振荡器的间隙数据。在我们的论文中,我们采取了不同的路线,并用特定的方法解决了这个问题。我们没有填充gappy时间序列,而是修改了要使用的度量,考虑了时间序列中的差距,从而使时间序列的基本动态保持不变,没有人为干预。我们的方法被称为“度量自适应映射去除”(MAGR),它适用于多元时间序列的任何度量,我们在这里用两个相关度量(互相关和互信息)和一个格兰杰因果度量(转移熵)对其进行了简化。我们通过与线性随机多元自回归(MVAR)系统和非线性系统耦合德赫农映射上的填隙方法进行比较,证明了我们方法的有效性。我们随机移除生成的时间序列的样本,并使用我们的方法以及不同的缺口填补方法,估计缺口时间序列上的每个度量。此外,我们还考虑了在应用中经常遇到的固定或不同大小的连续样本块缺失的情况。本文其余部分的结构如下。第2节简要介绍了本研究中使用的相关性和因果关系度量的理论框架。第3节描述了我们计算gappy时间序列测度的方法。第4节给出了线性和非线性系统的仿真结果,用于使用我们的方法和间隙填充方法估计测量值。第5节介绍了MAGR在实际财务数据中的应用。最后,第6.2节讨论了结果。

报纸
大多数88 在职认证  发表于 2022-5-8 04:26:49
相关性和因果关系度量在下文中,我们简要介绍了当多元时间序列包含单个缺失值(称为单间隙)或缺失值块(称为块间隙)时,用于证明我们方法的三种度量。我们用大写字母表示变量,用小写字母表示样本值。本研究中考虑的度量是双变量的,对于多变量时间序列,它们应用于每一对时间序列。我们的多元测度方法,例如部分转移熵[28,22]的实现非常简单。2.1. 互相关对于给定时间序列{xt,yt}Nt=1的两个同时测量的变量X和Y,互相关测量X和Y在同一时间t的线性相关性,或延迟τ,定义为rxy(τ)=Corr(xt,yt+τ)=PN-τt=1(xt- \'x)(yt+τ- \'y)qPN-τt=1(xt- \'x)PN-τt=1(yt- 其中,x和y是两个时间序列的平均值。对于τ=0,rXY(0)是X和Y的标准皮尔逊相关系数。互信息互信息互信息是互相关的适当类比,如果要估计非线性相关。首先,根据熵asI(X;Y)=H(X)+H(Y)定义两个变量X和Y的互信息- H(X,Y),(2)其中H(X)和H(X,Y)分别是X的香农熵和(X,Y)的联合熵[5]。对于熵的估计,我们首先对X和Y进行离散,然后计算X,Y和(X,Y)的概率质量函数的标准频率估计,分别表示为pX,pY和pX,Y,给出i(X;Y)=XxXypX,Y(X,Y)logpX,Y(X,Y)pX(X)pY(Y)。(3) 我们在这里考虑X和Y的离散化,使用它们的域在b区间的等概率划分。

地板
能者818 在职认证  发表于 2022-5-8 04:26:52
因此,在每个区间都有相等的占有率,x的分区的第x个元素的概率pX(x)为pX(x)=1/b,y的概率为pY(y)=1/b。互信息的估计取决于所选的存储单元的数量b,这里我们使用b=√N/5[4,20]。时间序列{xt,yt}Nt=1的交叉互信息只是x和yt+τ,IXY(τ)=I(xt,yt+τ)的互信息。请注意,当τ=0时,两个测量值XY(0)和IXY(0)是对称的,表示XT和Yt的相关性,而对于τ>0,rXY(τ)或IXY(τ)的显著值表示XT和Yt+τ的相关性,可以粗略地解释为从X到Y的驱动响应关系[16]。对于后者,已经制定了更合适的措施,称为格兰杰因果测量。2.3. 转移熵是信息论中格兰杰因果关系的非线性度量,它是转移熵[26]。传递熵量化了在提前时间(最初被视为提前一个时间步)从变量X表示的系统流向变量Y表示的另一个系统的信息流,因此可以将其视为格兰杰因果关系度量。转移熵→Ys实际上是条件互信息I(Yt+1;Xt | Yt),其中Xt=[Xt,Xt-τ, . . . , Xt-(m)-1) τ]是X和Yt=[Yt,Yt]的重构向量变量-τ, . . . , Yt-(m)-1) τ]t代表Y,代表Y+1对X历史的依赖性,并说明其自身的历史。参数m是嵌入维数,τ是延迟时间,对于X和Yas来说,都是相同的。发现这种选择对于耦合的检测是最佳的[21]。条件互信息可以用熵来表示,我们有TEX→Y=-H(Yt+1,Xt,Yt)+H(Xt,Yt)+H(Yt+1,Yt)- H(Yt)。

7
可人4 在职认证  发表于 2022-5-8 04:26:55
(4) 高维向量变量熵的binning估计是不恰当的,相反,我们使用相关和H(Xt)=log C(Xt,r)+log r[18]给出的熵估计,其中距离r的相关和isC(Xt,r)=(N- (m)- 1) τ)(N)- (m)- 1) τ+1)NXi=(m)-1) τ+1NXj=i+1Θ(r- kxi- xjk),(5)其中,Θ(x)是Heaviside函数,如果x>0,则为1,否则为0,xi是时间步i处x的样本重构向量。用相关和替换熵的估计,得到[21]TEX→Y=logC(Yt+1,Xt,Yt)C(Yt)C(Xt,Yt)C(Yt+1,Yt)。(6) 利用相关和对传输熵的估计取决于距离r,类似于装箱估计对装箱数量B的依赖。在使用相关和的应用中,r的选择各不相同,其中一个策略是在预定范围内搜索最佳r。我们以单向耦合的Henon映射为例,采用这种策略嵌入维度SM=1和m=2(τ=1)。在两个方向(TEX的最大值)上提供最大分辨力的最佳r→最接近零度的时间→十) 结果表明,r=0.2,其中时间序列被标准化为零均值和一个标准差。因此,在研究中,我们设定r=0.2.3。测量适应的差距消除现有的有差距时间序列的方法是尝试填补时间序列中的差距,然后继续分析衍生时间序列的方法。

8
mingdashike22 在职认证  发表于 2022-5-8 04:26:59
任何此类方法都是在对缺失值进行某种假设的情况下,使用一个模型来填补缺失值,并以这种方式对基础动态进行艺术干预——甚至是任意干预,如果没有理由选择特定的模型。最随意的方法是间隙闭合(GC),它抑制时间序列中的间隙并连接边缘,只有在时间序列中没有依赖项时才有效。我们遵循不同的策略,在时间序列中留下差距,并开始调整每种分析方法来解释差距。我们称这种方法为自适应间隙消除(MAGR)。在这项研究中,我们选择了多元时间序列的三个连通性度量来演示我们的方法,但该方法可以扩展到许多其他度量。实际上,它可以应用于任何多变量时间序列分析方法,该方法使用时间上接近的或顺序有序的1:两个时间序列X和Y,有间隙(第2列和第3列),其中时间序列Y也被提前一个时间步长(第4列)和后退一个时间步长(第6列)和后退一个时间步长(第5列)取代。时间XTYT+1Xt-1Yt-11 xyy2 xyyxy3 xy–xy4 x–yxy5–yyx–6 xyy–y7 XYYXYY8–yyxy9 xyy–y10 XYXY时间序列的样本。基本原理是只使用不包含间隙的样本集。下面我们将详细说明MAGR方法。首先,对于不需要重建向量进行估计的度量,例如线性互相关和互信息,可以很容易地解决这个问题:我们取对中非空值的交集(xt,yt+τ)。为了说明这一点,让我们考虑变量X和Y的两个时间序列,如表1(N=10)所示。

9
nandehutu2022 在职认证  发表于 2022-5-8 04:27:02
检查表1第2列和第3列中的成对值是否有空条目,我们将时间步骤4、5和8的成对值去掉,并分别对剩余的成对值进行(1)和(3)中的rXY(0)和IXY(0)的计算。对于非零滞后,同样的技术也适用,但现在一个时间序列的时间偏移了给定的时间滞后。假设时间延迟为1,rXY(1)和IXY(1)可以使用非空值对(xt,yt+1)进行计算,如表1所示,这些是时间步长1,2,4,6,7,9。当连通性度量需要时间序列的状态空间重构时,这种方法变得更加复杂,丢弃了更多的数据点,例如传递熵度量。特克斯→Y、 对于每个时间步t的非空值的要求涉及yt+1as以及xt=[xt,xt-τ, . . . , xt-(m)-1) τ]Tand-yt=[yt,yt-τ, . . . , yt-(m)-1) τ]T.对于m=1和τ=1的最简单情况,TE的计算基于由每个时间步T(矩阵中的行)的三元组(yt+1,xt,yt)组成的联合数据矩阵,并且必须检查每个三元组的空值。对于表1中的示例,对于时间步长3、4、5和8,必须丢弃更多的数据点。随着嵌入维数m的增加,丢弃数据点的数量也会增加。分别将X中的间隙数表示为Gx,Y中的间隙数表示为gY,如果只有X有间隙,则丢弃数据点的最大数量为d=mgX,如果只有Y有间隙d=(m+1)gY,则丢弃数据点的最大数量分别为d=mgX+(m+1)gY,而对于有间隙的X和Y,我们都有d=mgX+(m+1)gY。如果间隔出现在连续的时间步上或在X和Y中同步出现,则丢弃的数据点的数量小于d。例如,计算TEX→对于m=2和τ=1,yf需要五分位(yt+1,xt,xt-1,yt,yt-1) 对于非空值,考虑到表1的时间序列,时间步长2和7.4只有两个这样的五角星。

10
能者818 在职认证  发表于 2022-5-8 04:27:05
模拟和结果4。1.模拟设置为了检验MAGR的有效性,我们从线性到混沌和混沌系统生成时间序列,其中预先定义的样本数随机移除,并将使用MAGR获得的测量估计结果与其他填补间隙算法的结果进行比较。在模拟研究中,我们考虑了[17]中提出的使用线性插值(LI)、三次插值(CI)、样条插值(SPI)、最近邻插值(NNI)和随机插值(STI)的标准间隙填充技术,以及间隙闭合技术(GC)。第一个系统是线性多元自回归过程(MVAR)Xt=1.2Xt-1.- 0.95Xt-2+WXtYt=-0.5Xt-1.- 0.4Yt-9+WYt(7),其中WXT和WYtare白噪声过程(平均零和标准偏差1)彼此不相关(系统实际上由[30]中系统的两个第一个方程组成)。第二个系统是单向耦合的Henon mapXt+1=1.4- Xt+0.3Xt-1Yt+1=1.4- CXtYt- (1 -C) Yt+0.3Yt-1(8)其中C是耦合强度参数[25]。对于线性互相关和互信息度量,我们将C=0.7设置为接近完全同步,而对于传输熵估计,我们将C=0.4设置为具有适度耦合,其中→Yob达到最大值,因此可以最好地检测因果关系影响X→ Y.注意,对于任何C,我们都希望有TEY→十、 0.为了评估MAGR和其他处理差距、填补或消除差距的方法,我们计算了无差距时间序列和有差距时间序列的相关性和因果关系度量。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 03:08