楼主: 何人来此
1062 24

[量化金融] 时间序列临界转移的拓扑识别 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-10 14:54:02
我们现在将底层动力系统视为一个“黑箱”,即观察者未知。我们将时间序列X转换为pN'd'1q d维延时坐标向量序列z“px,X,…,xd'1q,z”px,X,…,xdq,¨¨zt”pxt,xt'1,…,xt'd'1q,¨¨zN'd”pxN'd,xN'd'1,…,xN'1q,其中嵌入维度d是适当选择的。在下面的应用程序中,我们只对检测d“一维对象(循环)感兴趣,在这种情况下,我们可以安全地选择dě3,因为Takens定理。我们应用滑动窗口Zt“tzt,zt\'1,…,zt\'w\'1u大小为w,对于t Pt0,…,N\'d\'w\'1u,w足够大,具有d!w!N。向量tzt,zt\'1,…,zt\'w\'1u形成嵌入Rd中的时变点云。该点云通常位于“瞬时吸引子”aλt的某个小邻域中,除了λt接近分岔值外,其中点云可能会改变方向吸引子。临界过渡的拓扑识别7系统的时间演化现在由Rd中的点云Ztof wpoints描述,该点随时间变化。根据所考虑的系统,根据经验选择窗口的大小w。启发式准则是,当λ远离分岔值时,大小为w的点云应大到足够大,以便捕捉“瞬时吸引子”Aλt的拓扑;另一方面,如果w太大,那么点云将融合对应于多个“瞬时吸引子”的拓扑信息,这可能会在窗口上发生本质变化。在第2.3节中,我们将描述一种提供每个时变点云Zt拓扑表示的方法。

12
可人4 在职认证  发表于 2022-6-10 14:54:06
将此方法应用于点云的结果是一个持久性图(表示某个度量空间中的一个点)或一个持久性景观(表示某个Banachspace中的一个点)。我们使用这种拓扑信息来检测临界转变的早期信号。启发式地,当底层动力系统经历临界过渡时,相应点云的持久性景观的范数会增加。2.3. 时变点云的拓扑数据分析。在本节中,我们简要回顾了应用于点云的持久性同源性和持久性景观的思想。有关此方法的技术详细信息,请参见,,[15、7、17、4、12、5]。对于时间t P t1,…,的每个瞬间,N'd'w'2u,我们考虑第2.2节中相应的点云tZtuDrds。为了简化符号,让我们定义这样一个点云,并用Z“tz,…,zw'1u表示。我们将其关联为一个拓扑空间,如下所示。引入一个“分辨率”参数εa0。定义所谓的Dietoris Rips simplicial complex RpZ,εq,或简单的Rips complex,如下所示:“0,1,…,顶点tzi,…,ziku的k-单纯形是RpZ,εqif的一部分,并且只有当其任何一对顶点之间的相互距离小于ε时,对于所有的zij,zilP tzi,…,ziku,这是pzij,zilqaε。换句话说,当该单纯形的顶点在ε的分辨率水平上“彼此不可区分”时,k-单纯形包含在RpZ,εq中。Rips simpli阳离子络合物RpZ,εq形成过滤,即RpZ,εqDRpZ,εq无论何时εaε。对于每一个这样的复合体,我们可以计算其在某些领域具有系数的n维同源性HnpRpZ,εqq。

13
mingdashike22 在职认证  发表于 2022-6-10 14:54:11
非正式地说,0维同源群HpRpZ,εqq的生成元对应于RpZ,εq的连接成分,1维同源群HpRpZ,εqq的生成元对应于RpZ,εq,8 M.GIDEA,D.GOLDSMITH,Y.KATZ,P.ROLDAN和Y.SHMALOgenerators中的“独立环”,2维同源群HpRpZ,εqq对应于RpZ、εq等中的“独立空腔”。对于本文的其余部分,我们将仅使用一维同源性。Rips复合物的过滤特性导致相应同系物的过滤,即HnpRpZ、εqqDHnpRpZ、εqq,无论何时εaε,foreach n。这些内含物决定了εaε的规范同态HNPPZ、εqq~aHNPZ、εqq。由于这个诱导映射族,对于每个非零n维同调类α,都存在一对值εaε,例如:“αP HnpRpZ,εqq但不在任何HnpRpZ的图像中,ε'δqq在相应同态下,对于δa0,”“α在HnpRpZ中的图像,εqq对于所有εaεεεεε,但α在HnpRpZ中的图像,εqq为零。”。在这种情况下,有人说,类α在参数值bα处“出生”:“ε,在参数值dα处“死亡”“ε;配对pbα,dαq代表α的‘出生’和‘死亡’指数。点pbα,dαq的多重性μαpbα,dαq等于在bα出生和在dα死亡的类α的数量。由于简单复合物是有限的,所以这种多重性是有限的。所有尺度下的n维同源生成器的信息都可以在持久性图Pn中编码。

14
能者818 在职认证  发表于 2022-6-10 14:54:23
该图包括:“对于每个n维同源类α,指定一个点pα”pαpbα,dαq pr及其多重性μα“uαpbα,dαq;”此外,pn包含R正对角线上的所有点;这些点代表所有在每个级别上出生和立即死亡的平凡同源生成器;对角线上的每个点都有有限的多重性。持久性图的轴是横轴上的出生指数和纵轴上的死亡指数。持久性图的空间可以是嵌入到Banach空间中,其范数可用于导出度量。其中一种嵌入基于持久性景观,由Banach空间lppn^Rq中的函数序列组成。对于每个出生-死亡点pbα,dαq P Pn,我们首先定义一个分段线性函数(2.2)fpbα,dαqpxq“$&%x'bα,如果x P'bα,bα'dα';'x'dα,如果x P'bα'dα,dα';0,如果x R pbα,dαq。对于由有限个对角点组成的持久图pn,我们将函数序列λ“PλiqiPN关联起来,其中λi:R nir0;1s由(2.3)λipxq给出“i-maxtfpα,dαqpxq | pbα,dαq P临界跃迁的自动识别9,其中i-max表示函数的第i个最大值。我们设置λipxq“如果不存在第四个最大值,则为0。图3中显示了点云的一个示例,相应的持久性图和持久性景观。通过上述嵌入,持久性景观形成了Banach空间LppN^Rq的子集,其中λ的范数由以下公式给出:(2.4)}λ}p“"yi”1}λi}pp,1{p.以上,}¨}pdenotes Lp范数,pě1,即}f}p“`R”| f | p1{p,其中积分与R上的Lebesgue测度有关。对于本文的其余部分,我们将仅使用Lnorm。上述持久图和持久景观的计算将针对每个滑动窗口Zt进行。

15
可人4 在职认证  发表于 2022-6-10 14:54:26
输出是相应持久性景观t}λti}uiě0u的L-范数的时间序列。这可以通过以下管道进行总结:Zt'Y~ntRpZt、εquε221'Y~ntHpRpZt、εqquε221'Y~ntλtiuiě0'Y~nt}λt}uiě0。点云Rips复杂同调景观L-normA使持久同调适用于分析数据的一个显著特性是其在小扰动下的鲁棒性。非正式地说,这一特性表明,如果基础点云数据有微小变化,那么相应的持久性图中的变化也很小。2.4. K-均值聚类。为了精确地捕捉基本时间序列和L-范数之间的关系,我们使用了一种无监督机器学习技术,该技术利用非参数、基于几何的k-均值聚类。与大多数统计测试相比,该方法的主要好处在于无需事先满足统计假设。基本算法从k个初始质心(随机选择)开始,将每个数据点分配到最近的质心;分配给同一质心的每个点集合形成一个簇。对于每个簇,平方误差计算为数据点和簇质心之间欧氏距离的平方和。然后重新计算并更新每个簇的质心,并重复将数据点分配给簇的过程。迭代该过程,直到结果稳定,即更新后的质心保持不变,并且没有点改变群集。当聚类平方误差不能进一步减小时,就可以实现这一点。初始(随机)质心的不同选择可能会产生不同的簇。为了获得聚类对初始选择的独立性,我们运行大量随机初始质心,然后选择产生最小聚类平方误差的质心。

16
nandehutu2022 在职认证  发表于 2022-6-10 14:54:29
需要在算法开始时预先指定集群的数量。有10种M.GIDEA、D.GOLDSMITH、Y.KATZ、P.ROLDAN和Y.SHMALOseveral基本方法——“肘部”、“轮廓”和“间隙统计”来确定最佳聚类数。有关调查和参考资料,请参见【25】。我们在第3节中说明了此方法的应用,然后在第4节中使用它。作为k均值聚类的输入,在第3节中,我们将使用感兴趣的时间序列的值和与时间序列相关的持久性景观的L-范数。在第4节中,我们将使用日志返回、与日志返回相关联的持久性环境的Lnorms以及资产价格的logo。我们加入了这个额外的时间序列,因为它代表了与市场行为特别相关的信息。K均值聚类的输出由数据子集组成,其时间序列的趋势与持久性景观的L-范数的趋势一致。3、带噪混沌时间序列我们考虑从带噪混沌动力系统导出的时间序列,在此基础上测试上述方法以检测临界跃迁。所研究的系统由三维微分同态给出,对于某些参数值,该系统具有洛伦兹型混沌吸引子【23】。我们强调,这与产生经典洛伦兹吸引子的著名微分方程系统不同。我们之所以选择这个特殊的模型,是因为它是一个离散时间动态系统,并生成一个具有有趣拓扑结构的三维吸引子,因此适用于TDA。此外,这是一个agenuine混沌吸引子,在这个意义上,混沌吸引子持续存在于参数空间中的开放域,因为它不显示稳定窗口(如logistic映射或H'enon映射的情况)。

17
大多数88 在职认证  发表于 2022-6-10 14:54:33
此外,这种类型的吸引子自然发生在几种类型的同宿分支的展开中,因此保证存在于自然应用的模型中。产生动力学的异态性是:(3.1)fpx,y,zq公司“py,z,M ` Bx ` My'zq,其中M,B,Mare是实参数。对于M,B,M的某些值,所有合适的初始条件都渐近逼近混沌吸引子。当Mand Bare保持固定且变化错误时,系统从单个吸引执行点演化为一对吸引固定点,然后演化为一对吸引周期轨道,最终演化为混沌吸引子. 图1显示了M“0,B”0.7和变化M的分岔图。分岔图中的每条垂直线表示对应M参数值在吸引子x坐标上的投影。图2显示了吸引子的几个实例。首先,我们使用该模型来说明第2.3节中介绍的方法;我们为M生成吸引子“0,B”0.7,M”0.81,然后我们利用4D嵌入从x时间序列重建相空间;因为我们只对吸引子的一维同源性感兴趣,所以使用d“4临界跃迁的拓扑识别110.00.30.60.90.750 0.775 0.800 0.825 0.850m2x图1。洛伦兹型映射的分岔图(3.1),inpM,xq坐标。0.2 0.3 0.4 0.5 0.60.2 0.3 0.4 0.5 0.6 x[反式:N]Y[反式:N]0.1 0.2 0.3 0.4 0.5 0.6 0.70.1 0.2 0.3 0.4 0.4 0.5 0.6 0.7 x[反式:N]Y[反式:N]0.0.2 0.4 0.6 0.80.0.2 0.4 0.6 0.8 Y[反式:N]Z[反式:N]0.0.2 0.4 0.6 0.6 0.0 80.0 0.2 0.4 0.6 0.8Y[变速器:N]Z[变速器:N]图2。顶部:Lorenz型吸引子,由(3.1)生成,对于:(i)M“0.8(左上),(ii)M”0.81(右上),底部:(iii)M“0.83(左下),(iv)M2”0.85(右下)嵌入维数是有效的。

18
nandehutu2022 在职认证  发表于 2022-6-10 14:54:36
然后,我们计算持久性图和相应的持久性景观。见图3。其次,我们考虑具有缓慢演化参数的系统,即(3.1)迭代的每一步,我们将参数Mby增加12 M.GIDEA、D.GOLDSMITH、Y.KATZ、P.ROLDAN和Y.SHMALOxyz0.20.30.40.50.60.7xyz0.20.30.40.50.60.70.00 0.05 0.10 0.15 0.200.00 0.05 0.10 0.15 0.20出生死亡0.05 0.10 0.10 0.15 0.200.00 0.01 0.02 0.03.04tseqLands1。ls。1图3。示例:(a)Lorenz型吸引子,由(3.1)生成,对于M“0,B”0.7,M“0.81,(B)重建的Lorenztype吸引子,(c)持久图,其中0维代数生成器显示为点符号(黑色),1维生成器显示为三角形符号(红色);距离对角线最远的两个主三角形符号对应两个周期轨道(循环); 其他三角形符号对应于点云中的色调循环,(d)一维持久性景观λ“pλkqk,表示k”1、2、3;两个主峰对应于两个周期轨道(循环),较小的峰值对应于噪声循环。增量。即:xt\'1“yt,yt\'1”zt,zt\'1“M\'Bxt\'M2,tyt\'zt,M2,t\'1”M2,t`M、 (3.2)我们选择的地方M“2.8^10'5。我们还向系统中添加了小高斯噪声,如(2.1)所示;我们选择噪声强度 “10'3.临界跃迁的拓扑识别130.75 0.76 0.77 0.78 0.79 0.80 0.810.1 0.2 0.3 0.4 0.5 0.6 0.7M2seqXseriesFigure 4.噪声洛伦兹型系统的x时间序列。我们注意到,从一些初始条件px、y、zq和一些初始参数值M开始,由(3.2)生成的x时间序列如图4所示,与图1中由(3.1)生成的分岔图密切相关,但并不完全相同。

19
可人4 在职认证  发表于 2022-6-10 14:54:39
产生差异的原因是,在迭代的每一步,对应M2、t的吸引子都会发生一些变化,点pxt、yt、ztq的一步迭代始终落后于吸引子,吸引子的参数现在已更改为M2、t\'1。由于我们对关键过渡感兴趣,我们在M“0.81处切割时间序列,这大约是对应于具有冻结参数的混沌吸引子分岔的参数值;见图1。与之前一样,我们提取x时间序列,并使用d“4维延迟坐标向量重建相空间。时间序列的总长度为N”2100个点。我们使用宽度为w的滑动窗口“100在四维向量序列上生成一个四维点云序列,每个点云由100个点组成。这将生成2000个点云数据集。在这个点云序列上,我们应用TDA,获得一维持久性景观的TL范数的时间序列。见图5(a)。如第2.2节所述,参数增量MHA必须足够小,以便连续的“瞬时吸引子”彼此非常接近。在上述实验中,较小的条件是,对于无噪声的系统(3.2),连续持久性景观的L-范数之间的差异在绝对值上小于δ“10'4。为了进行比较,我们还对相同参数范围内无噪声的洛伦兹类型系统进行了相同的计算。见图5(b). 值得注意的是,对于无噪声的系统,在临界过渡之前,L-范数基本上没有增加,而对于有噪声的系统,在M“0.81之前,L-范数急剧增加,尽管增加的噪声很小 “10'3.14 M.GIDEA、D.GOLDSMITH、Y.KATZ、P.ROLDAN和Y。

20
何人来此 在职认证  发表于 2022-6-10 14:54:42
SHMALO0.76 0.77 0.78 0.79 0.80 0.810.000 0.001 0.002 0.003 0.004M2seqAUC\\u土地。v0.76 0.77 0.78 0.79 0.80 0.810e+00 1e-04 2e-04 3e-04 4e-04M2seqAUC\\u土地。V图5。左:(a)Noisy-Lorenz型系统持久图的L-范数;右:(b)无噪声Lorenz型系统持久图的L-范数。-3.-2.-101-2 DIM2(33.3%)、Dim3(16.2%)聚类图AAAAA12345678聚类图6。含噪Lorenz型系统时间序列的k均值聚类。为了捕捉x时间序列和L-范数之间的关系,我们使用第2.4节中描述的K均值聚类分类。作为输入,我们使用x时间序列的值和持久性景观的L-范数。为了更好地分割数据,我们使用了相对较多的群集SK“8.聚类如图6所示:聚类2和3看起来最为重要,因为它们与其他聚类明显分开。表6.1给出了相应的数据。与这些聚类相对应的参数M介于0.80837和0.80997之间。本实验的结论是,即使滑动窗口的大小(因此,关键转变的拓扑识别15基础点云的大小)相当小。在噪声系统中,即使在分岔值之前,L-范数的时间序列也会随着“湍流”的增加而增长。这是临界转变理论中一种众所周知的行为类型,在这种行为中,系统的不稳定性通过添加小噪声而放大,从而提供临界转变的早期迹象(参见,例如,[42])。加密货币分析是一种新型金融资产。UnderlyngBlock链技术非常强大。然而,相关汇率的时间序列以价值的剧烈波动为特征。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:07