楼主: mingdashike22
1921 30

[量化金融] 金融时间序列的拓扑数据分析 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-31 06:14:55
通常,不可能在持久性图和景观之间来回切换。存在与持久性图不对应的景观,例如,如果λ、λ是通过等式(2.1)分别从对应的持久性图P、PP P导出的两个持久性景观,通过等式(2.1),平均值“λ”pλ`λq{2可能与任何持久性图“p p p p”不对应;请参见[5]。然而,巴拿赫空间结构使持久性景观适合通过统计方法进行治疗。3.方法描述和合成时间序列测试在第4节中,我们将使用持久性景观及其规范(p“1和p”2)分析金融时间序列。我们将看到,这些规范在金融崩溃之前表现出大幅增长,而当市场稳定时,它们表现出温和的行为。在本节中,我们将解释我们的分析方法,并在由各种非线性和非平衡模型生成的多个综合多维时间序列上进行测试。目的是评估信号的各种特征如何影响持久性景观Lp标准的增长。3.1。方法考虑d时间序列txknun,其中k“1,…,d,和一个大小为w的滑动窗口。对于每个实例tn,我们有一个点xptnq“pxn,…,xdnq P Rd。然后对于每个大小为w的时间窗口,我们有一个由Rd中的w个点组成的点云数据集,命名为xn“pxptnq,xptn\'1q,…,xptn\'w\'1qq。从算法上讲,点云是由ad^w矩阵形成的,其中d是与所研究的1个时间序列的数量相对应的列数,w是窗口的大小,它决定了列的长度。然后,在点云的时间序列顶部应用TDA来研究多个时间序列的时变拓扑特性维度时间序列,从一个窗口到另一个窗口。

12
可人4 在职认证  发表于 2022-5-31 06:14:59
对于每个点云,我们计算其过滤的持久性图、相应的持久性景观及其Lp规范。我们使用高效的计算算法和相关的TDA库,允许从噪声观测中计算拓扑特征【23】。在我们的实现中,我们采用了R包“TDA”[24],这大大简化了应用程序编程接口。在下面的小节中,我们将说明我们分析由随机版本的H’enon映射生成的时间序列的方法。备注3.1。现在,我们将我们的方法与基于延时坐标嵌入的著名方法进行比较【25】,该方法广泛用于一维信号的常规分析和TDA研究。首先,我们描述了基本信号是平稳的,并且表示混沌吸引子的时间序列(隐藏在“黑盒子”中)的情况。sizem的滑动窗口应用于此时间序列,窗口的每个实例都会产生一个inRm点。该理论确保了在rm中生成的点集表示(近似)吸引子在m维空间中的嵌入,前提是维度选择不当足够大:至少是吸引子分维的两倍[26]。有几种方法可以直接从时间序列估计实现嵌入所需的最小维数M【27,28】。我们应该强调,当吸引子的维数较大或存在噪声时,这种方法越来越难以应用;另见【30】。我们描述的第二种情况是,一维时间序列与非平稳过程相关联;我们遵循[15]。给定一个长的1D时间序列,可以将其分成多个预定大小w的段。

13
大多数88 在职认证  发表于 2022-5-31 06:15:02
在每个段中,对时间序列应用大小为m的滑动窗口,其中窗口的每个实例由时间序列中m个连续数据点的序列组成,其中m!w、 同样,必须选择适当大的m。每段滑动窗口的时间顺序形成一个大小为pw'm'1qin Rm的单点云。因此,可以获得m维空间中1Ddataset的长度为w的每一段的表示。然后在嵌入点云的顶部应用TDA来研究时间序列的时变拓扑特性,从段到段。我们强调,我们的方法与延时嵌入方法截然不同。由于我们的目标并不是在某个高维空间中嵌入时间序列,因为这种嵌入实际上可能不可能实现,因为首先缺乏吸引子,并且时间序列固有的随机性,所以我们选择在低维空间中呈现时间序列,即在Rd中,其中d!w、 当我们在处理少数(即d)个独立的时间序列时。我们的方法只有一个参数,即沿时间序列滑动的窗口的大小w,这与时滞方法不同,时滞方法有两个参数,即分段的大小w和沿每个分段滑动窗口的大小m。我们强调,在【15】中,线段w的长度和我们的方法中滑动窗口w的长度起着相同的作用,即确定我们应用TDA的点云的大小,前者从一个线段到另一个线段,后者从一个窗口到另一个窗口。点云的维数m由前者的延时嵌入过程推导而来,并由后者考虑的时间序列数d自然给出。3.2。

14
mingdashike22 在职认证  发表于 2022-5-31 06:15:05
带噪声的混沌时间序列首先,我们回忆起H'enon映射[31],它可以被看作是众所周知的logistic映射的二维模拟。后者被用作预测经济周期的范例(参见,例如,【41】)。logistic图和H'enon图显示的稳定状态、分岔、周期性和混沌状态的演变为经济振荡和金融崩溃的动力学提供了一个有用的类比(参见,例如,[33])。基于动力系统分岔的金融崩溃模型参见【34】。H'enon映射的方程为:xn'1“1'axn'byn,yn'1“xn'1。(3.1)其中a、b为实参数。已经证明,对于a,b的某些值范围,平面上某个适当区域的每个初始条件px,yq,即“基本吸引”,序列pxn,ynq接近相同的不变集,称为H’enon吸引子。对于a和b的某些值,吸引子是混沌的。让我们输入参数b“0.3,设0dad1.4。数值实验表明,对于参数a的固定值,参数a的值为0aaa1.06,存在一个经历倍周期分岔的吸引子,而在<<1.06时,则存在混沌吸引子重新聚集;对于介于1.06和1.4之间的参数a,存在一个混沌吸引子的值区间,其中散布着值区间a的s,其中有一个吸引人的周期轨道。我们修改了H'enon吸引子的方程,通过使其中一个参数在时间上缓慢变化(类似于外部作用力),我们还用噪声修饰它。对于参数b的固定值(b“0.27、b”0.28、b“0.29和b”0.3),我们让参数a在时间上缓慢线性增长,从“0”到“1.4”,并添加高斯噪声。

15
能者818 在职认证  发表于 2022-5-31 06:15:08
也就是说,我们考虑系统:xn\'1“1\'anxn\'byn`σWn?t、 yn`1“xn`1`σWn?t、 an“1”an `t、 (3.2)其中Wn为正态随机变量,ta0是一个小步长,σa0是噪声强度。式(3.2)中的随机项对应于一个扩散过程。时间根据tn\'1“tn变化`t、 因此,ANC可以被视为等效于时间变量。该系统的x时间序列的实现如图2所示。第一我们生成x时间序列txknun的d“4个实现,其中k”1,…,d,参数b“0.27,b”0.28,b“0.29,b”0.3的每个值一个。因此,对于每个时间tn,我们有一个点xn“pxn,…,xdnq P Rd。对于滑动窗口w”50,我们生成一系列点云数据集xn“pxn,xn\'1,…,xn\'w\'1q。因此,每个曲面由Rd中的w个点组成。在图3中,我们显示了对应于不同时间瞬间的点云的二维投影;随着时间的推移,参数a的值增加。在每个点周围,我们绘制了一个半径较小(左栏)和半径较大(右栏)的蓝色圆,以说明循环是如何生成和消亡的。当确定的H’enon映射方程(3.1)具有稳定的固定点或低周期的稳定周期轨道时,顶部的面板对应于参数a的低值;相应的噪声H'enon映射等式(3.2)显示了一组点,或彼此相隔的几个簇。当确定性H'enon映射方程(3.1)经历了导致混沌吸引子的周期性加倍分岔时,底部的面板对应于参数a的较大值;相应的噪音0。2 0。4 0。6 0。8 1 1.2 1.41。510.500美元。图2:对应于系统等式(3.2)的x时间序列。横轴对应于参数a.H'enon map Eq的值。

16
大多数88 在职认证  发表于 2022-5-31 06:15:12
(3.2)显示了复杂的结构。接下来,对于每个浊点xnw,我们将相应的RIP过滤RpXn、εq、εa0关联起来,并分别计算1D持久性图PpXnq、相应的持久性景观λpXnq和土地L-范数:}λpXnq}和}λpXnq}。在图4中,我们显示了}λpXnq}(蓝色)和}λpXnq}(红色)的归一化时间序列。这两幅图都显示了标志着混沌行为开始的参数值a附近的急剧增加。我们还指出,当x时间序列向混沌区移动时,它们之间的互相关会衰减;在对初始条件有敏感依赖的混沌区域,互相关通常低于10%。同时,加入到信号中的噪声修整只起到了一定的作用。这个数值实验的结论是,在参数演化缓慢的系统中,持续景观的Lp范数能够检测从规则到混沌的过渡。从规则动力学到混沌动力学的传递决定了吸引子拓扑结构的显著变化,这可以通过Lp范数的时间序列非常清楚地识别出来。我们强调,我们仅使用此示例来测试所提出的方法。在下一小节中,我们将考虑一个与经验金融时间序列更相关的模型。1.5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。521年。5 1 0。5 0 0。5 1 1。5.21。510.500美元。511

17
kedemingshi 在职认证  发表于 2022-5-31 06:15:16
52图3:对应于不同时刻的点云的二维投影;随着时间的推移,参数a的值增加(从上到下)。围绕每个点,我们画一个半径较小(左列)和半径较大(右列)的蓝色圆圈,以说明各种循环的诞生和消亡。在线上色。0 20 0 40 0 60 0 80 0 10 00 12 000.0 0。2 0.4 0.6 0.8 1.0图4:带噪声的混沌时间序列。持久性景观的标准化L-范数(蓝色)和L-范数(红色)图;横轴对应时间步长,纵轴对应规范(详见正文)。在线上色。3.3。方差不断增长的白噪声理论定量金融中的经典假设是,股票价格遵循具有恒定漂移和扩散系数的几何布朗运动。该模型导致正态分布的股票收益,定义为价格对数的差异,由给定的时间间隔分隔。在下文中,我们使用我们的方法,对有限数d的持久性景观的Lp范数进行蒙特卡罗模拟“4白噪声。具体而言,我们希望测试下划线白噪声的增长方差是否会导致Lp-normals值的增加。我们的数值实验设计如下。首先,我们生成四个数据集,每个数据集有100个数据点,这些数据点选自正态分布Np0、pσ`δiqq和标准偏差σ`δi,其中σ”1和δi,i“1,…,4是从均匀分布r'0.1,0.1s中选择的。因此,我们在4Dspace中构建一个点云。我们多次重复此过程。对于生成集xnw的每个实现,我们关联相应的Rips过滤RpXn、εq、εa0,并计算持久性图PpXnq、相应的持久性景观λpXnq和Lp规范:}λpXnq}和}λpXnq}。

18
大多数88 在职认证  发表于 2022-5-31 06:15:20
我们收集每次实现时获得的Lp范数值,并在第一次模拟结束时计算其平均值。我们运行该模拟10次,σ从1依次增加到10,并发现持久性景观的L-和L-范数的平均值图5:蒙特卡罗模拟,100次实现,持久性景观的L(红线)和L(蓝线)范数对白噪声不断增长的方差的依赖性,标记在横轴上(有关详细信息,请参见正文)。在线上色。随着迭代次数的增加,快速收敛到白噪声平均方差的线性增加函数,见图5。这一结果并不令人惊讶。当白噪声的平均标准偏差增加一些比例因子F时,对持久性图的影响是,每个点pb、dq变为pF¨b、F¨dq,并且每个函数λk(见(2.2))图下的面积改变了一个因子F。因此,在这种情况下,Lp范数的值与方差σ成正比。3.4。伽马分布逆方差白噪声自20世纪60年代初以来,已知股票收益率的PDF具有“厚尾”[35,36]。不同资产类型和多个时间尺度上的相对价值变化的非高斯分布是一个既定的程式化事实,参见,例如,【37,38】和其中的参考文献。有强有力的证据表明,股票收益波动性的时间演化是由其自身的随机过程决定的【39】。人们对在非扩展统计学(40、41、42、43、44、45)和“超级统计学”(46、47、48、49、50、51、52)的框架内对金融时间序列建模越来越感兴趣。超统计方法[53]显著简化了对资产收益率对数x的时间演化的描述。

19
能者818 在职认证  发表于 2022-5-31 06:15:23
简而言之,该模型基于这样一个假设,即局部动力学的典型弛豫时间τ远短于外部驱动的已实现方差函数的时间尺度Tγ,σ“1{γ。假设包含n个数据点的给定离散时间序列可以划分为n个{Tγ时间片,其中x的局部平衡正态分布和实现的局部方差的不同值。因此,对于n“1,长期T”Tγ,x的无条件概率分布通过两个分布的叠加来近似(因此,超统计):x的局部正态分布和逆方差pxq“zaγ{2πexpp'γx{2qfpγqdγ的概率分布f pγq。(3.3)由该公式表示的γ边缘化最初是由Praetz提出的,他表明股票对数的高斯PDF的有限混合返回的γ分布精度为:fpγ;α,βq“βαΓpαqγα'1expp'βγq,γě0,α,βa0,(3.4)产生了标度的Student t分布,它提供了比正态分布更好的经验数据。这里,pαq是伽马函数,α和β分别是伽马分布的形状和速率参数。对于较大的α,伽马分布收敛到具有平均u的高斯分布“α{β和方差σ”α{β。在这个极限下,等式(3.3)恢复了对数收益的正态分布,它遵循了经典的等位价格几何布朗运动模型。然而,对于对应于高方差的高权重的形状参数的较小值,请参见图6-(a),等式(3.3)导致x的厚尾分布。正如Praetz所指出的,通过类比布朗运动,单位时间间隔内价格变化的方差(差异系数)与股票市场缓慢变化的“温度”成正比。

20
mingdashike22 在职认证  发表于 2022-5-31 06:15:26
。,代表市场的活跃程度或活力”。他对这个问题的见解和表述仍然具有难以置信的价值。最近对道琼斯工业平均指数(DJIA)和标准普尔500指数(S&P500)的每日时间序列的研究表明,γ的经验分布接近于γ分布[47,55]。由于本文的主要目的是探索TDA信息在即将到来的金融崩溃中的效用,这通常与“市场温度”有关,在下文中,我们使用我们的方法,使用伽马分布逆方差对d“4白噪声的持续景观的Lp范数进行蒙特卡罗模拟。我们在4D空间中生成100个点云,每个点云有100个数据点,这些数据点从四个正态分布Np0,γ'1中选择{2q,γ是从100个γ分布变量中随机抽取的。为了模拟市场从“冷”(低方差)状态到“热”(高方差)状态的转变,对于前75个点云,我们将尺度参数保持在相对较高的α“8。然后,我们将最后25个步骤中的每个步骤的该参数降低0.25。我们将速率参数保持固定,β“1.对于每个生成的点云xnw,我们将相应的RIP过滤RpXn、εq、ε0关联起来,并计算1D持久性图PpXnq、相应的持久性景观λpXnq和规范:}λpXnq}和}λpXnq}。我们重复此过程多次,收集每次实现时获得的Lp规范值,并计算相关平均值。如图6所示-(b) 我们给出了L-范数的归一化时间序列和下划线噪声的平均方差,平均超过100次实现;L-范数的行为几乎与L-范数的行为无法区分,此处未显示。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 10:22