楼主: mingdashike22
1918 30

[量化金融] 金融时间序列的拓扑数据分析 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-5-31 06:14:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Topological Data Analysis of Financial Time Series: Landscapes of
  Crashes》
---
作者:
Marian Gidea and Yuri Katz
---
最新提交年份:
2017
---
英文摘要:
  We explore the evolution of daily returns of four major US stock market indices during the technology crash of 2000, and the financial crisis of 2007-2009. Our methodology is based on topological data analysis (TDA). We use persistence homology to detect and quantify topological patterns that appear in multidimensional time series. Using a sliding window, we extract time-dependent point cloud data sets, to which we associate a topological space. We detect transient loops that appear in this space, and we measure their persistence. This is encoded in real-valued functions referred to as a \'persistence landscapes\'. We quantify the temporal changes in persistence landscapes via their $L^p$-norms. We test this procedure on multidimensional time series generated by various non-linear and non-equilibrium models. We find that, in the vicinity of financial meltdowns, the $L^p$-norms exhibit strong growth prior to the primary peak, which ascends during a crash. Remarkably, the average spectral density at low frequencies of the time series of $L^p$-norms of the persistence landscapes demonstrates a strong rising trend for 250 trading days prior to either dotcom crash on 03/10/2000, or to the Lehman bankruptcy on 09/15/2008. Our study suggests that TDA provides a new type of econometric analysis, which goes beyond the standard statistical measures. The method can be used to detect early warning signals of imminent market crashes. We believe that this approach can be used beyond the analysis of financial time series presented here.
---
中文摘要:
我们探讨了2000年技术崩溃和2007-2009年金融危机期间四大美国股市指数日收益率的演变。我们的方法基于拓扑数据分析(TDA)。我们使用持久性同源性来检测和量化多维时间序列中出现的拓扑模式。使用滑动窗口,我们提取与时间相关的点云数据集,并将其与拓扑空间相关联。我们检测出现在这个空间中的瞬态循环,并测量它们的持久性。这是在实值函数中编码的,称为“持久性景观”。我们通过其$L^p$标准量化了持久性景观的时间变化。我们在由各种非线性和非平衡模型生成的多维时间序列上测试了这个过程。我们发现,在金融危机附近,美元/便士的标准值在主峰之前表现出强劲的增长,主峰在崩盘期间上升。值得注意的是,在2000年10月3日网络崩溃或2008年9月15日雷曼兄弟破产之前的250个交易日内,持久性景观的美元/便士-标准时间序列低频平均频谱密度呈现出强劲的上升趋势。我们的研究表明,TDA提供了一种新的计量经济分析,它超越了标准的统计指标。该方法可用于检测即将发生的市场崩溃的预警信号。我们认为,这种方法可以用于本文所述的金融时间序列分析之外的其他领域。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--
一级分类:Mathematics        数学
二级分类:Dynamical Systems        动力系统
分类描述:Dynamics of differential equations and flows, mechanics, classical few-body problems, iterations, complex dynamics, delayed differential equations
微分方程和流动的动力学,力学,经典的少体问题,迭代,复杂动力学,延迟微分方程
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--

---
PDF下载:
--> Topological_Data_Analysis_of_Financial_Time_Series:_Landscapes_of_Crashes.pdf (4.4 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:金融时间序列 数据分析 时间序列 Mathematical Quantitative

沙发
nandehutu2022 在职认证  发表于 2022-5-31 06:14:28
金融时间序列拓扑数据分析:CrashesMarian GideaYeshiva大学数学科学系景观,纽约州纽约市,邮编:10016;USAYuri KatzS&P Global Market Intelligence,55 Water Str.,纽约州纽约市,邮编:10040;UsaAbstracts我们探讨了2000年技术崩溃期间四大美国股市指数日收益率的演变,以及2007-2009年的金融危机。我们的方法基于拓扑数据分析(TDA)。我们使用持久性同源性来检测和量化多维时间序列中出现的拓扑模式。使用滑动窗口,我们提取与时间相关的点云数据集,并将其与拓扑空间相关联。我们检测出现在这个空间中的瞬态循环,并测量它们的持久性。这是用实值函数编码的,称为“持久性景观”。我们通过Lp规范量化了持久性景观的时间变化。我们在由各种非线性和非平衡模型生成的多维时间序列上测试了这个过程。我们发现,在金融崩溃附近,Lp标准在主峰之前表现出强劲增长,主峰在崩盘期间上升。值得注意的是,在2000年10月3日网络崩溃或2008年9月15日雷曼破产之前的250个交易日内,持久性景观Lp范数时间序列的低频平均频谱密度呈现出强劲的上升趋势。我们的研究表明,TDA提供了一种新的计量经济分析,它补充了标准统计指标。该方法可用于检测即将发生的市场崩溃的预警信号。我们认为,这种方法可以用于本文所述的财务时间序列分析之外的其他领域。关键词:拓扑数据分析、金融时间序列、预警信号SPACS:05.40-a、 05.45。

藤椅
mingdashike22 在职认证  发表于 2022-5-31 06:14:31
tp电子邮件地址:Marian。Gidea@yu.edu(玛丽安·吉迪亚),尤里。katz@spglobal.com(尤里·卡茨)预印本于2017年4月11日提交给Physica A。简介拓扑数据分析(TDA)[1,2]是指统计、计算和拓扑方法的组合,允许在数据中发现形状相似的结构。TheTDA已被证明是一种针对复杂多维和噪声数据集的强大探索方法。为了应用TDA,数据集被编码为某些度量空间中的一组有限点。TDA的一般和直观原理基于k维孔洞的持久性,例如。,在拓扑空间中,连接的组件pk“0q,循环pk”1q等,该拓扑空间是从随机样本中推断出来的,用于查看数据的范围很广(分辨率)。因此,持久同源性是考虑中的关键拓扑属性【3,4】。计算与点云数据集相关的持久同源性的过程涉及构建简单复合物的过滤,按照某些分辨率(缩放)参数排序。随着分辨率参数的变化,一些拓扑特征出现在相应的单纯形复形中,而另一些拓扑特征消失。因此,每个拓扑特征都有一个“出生”和一个“死亡”值,这两个值之间的差异代表了该特征的持续性。在较大范围内持续存在的拓扑特征可被视为重要特征,而在较小范围内持续存在的特征可被视为不太重要或不重要特征。

板凳
nandehutu2022 在职认证  发表于 2022-5-31 06:14:34
持久性同源性方法的一个重要特性是,它不需要在“信号”和“噪声”之间进行人工分割;保留数据中出现的所有拓扑特征,并根据其持久性分配“权重”。过滤过程的输出通过持久性图以简洁的形式捕获。图中每个点的两个坐标表示k维孔的出生值和死亡值。总结持久性图中包含的信息的另一种工具是持久性景观[5,6]。后者由一系列连续的分段线性函数组成,这些函数定义在重新缩放的出生-死亡坐标中,这些坐标来自持久性图。持久性图具有自然的度量空间结构,而持久性景观则自然地嵌入到Banach空间中。因此,可以研究持久性景观的统计特性,例如,计算期望值和方差以及其他特性【5,7】。持久性同调的一个显著特性是,持久性图和持久性景观在底层数据的扰动下都是鲁棒的。也就是说,如果数据集变化很小,那么持久性图/持久性景观只会移动很小的距离。这一特征是mathematicallywell利用持久性同源性建立的统计发展的关键因素。对多管闲事多维数据集中稳定拓扑结构(或“形状”)的探索带来了新的见解,包括乳腺癌亚群的发现[8],积极用于图像处理[9],信号和时间序列分析[10、11、12、13、14、15]。

报纸
kedemingshi 在职认证  发表于 2022-5-31 06:14:37
后者主要用于检测和量化数据中的周期模式【16,17】,了解复杂动力系统相空间中混沌吸引子的性质【18】,分析湍流【19】,以及stockcorrelation网络【20】。在这些研究的推动下,本文研究了将TDA应用于金融时间序列是否有助于检测金融市场中不断增长的系统性风险。尽管决策者和市场参与者有着明显的实际利益,但由于金融系统的复杂性和非平稳性,预测灾难性市场崩溃是出了名的困难。在过去几十年中,受到复杂自然系统突变分析、金融市场预警信号(EWS)设计的启发,越来越多的实证和理论研究,参见,例如,[21]和其中的参考文献。对不同市场的观察表明,金融崩溃之前,股市指数的方差不断增大,时间序列的频谱密度向低频移动,以及相互关联不断增加。然而,对于金融危机的机制还没有达成共识。此外,即使是对即将到来的金融灾难进行相对短期的预测,仍然是一个公开的挑战。我们分析了四大美国股市指数的日对数收益率时间序列:标准普尔500指数、道琼斯工业平均指数、纳斯达克指数和罗素2000指数。总的来说,这些有噪声的1D信号在4D空间中形成了一个多维时间序列。我们沿着这些时间序列应用一定长度的滑动窗口w,从而为窗口的每个实例获得4D点云。滑动步长设置为一天。然后,我们计算每个4D点云中循环的持久性景观(1D持久同调)的THLP范数(p“1和p”2)。

地板
可人4 在职认证  发表于 2022-5-31 06:14:40
由此产生的Lp规范时间序列允许跟踪股票市场状态的时间变化。我们发现,Lp标准的时间序列在主峰之前表现出强劲的增长,主峰在崩盘期间上升。值得注意的是,在2000年10月3日网络崩溃或2008年9月15日莱曼破产之前的250个交易日内,持续性景观规范时间序列的平均频谱密度在低频下呈现出强劲的上升趋势。我们的研究表明,TDA提供了一种新型的经济计量分析,可用于检测即将发生的市场崩溃的EWS。该方法非常通用,可以应用于任何资产类型和时间序列的混合。在第2节中,我们简要而非正式地回顾了TDA的背景和本文采用的关键概念。在第3节中,我们将上述方法与传统的延时坐标嵌入方法进行了比较。我们在由各种非线性和非平衡模型生成的多维时间序列上测试了所提出的方法。这些测试有助于评估潜在过程的特征如何影响持久性景观。在每种情况下,我们都让基础过程的参数以特定的方式改变,并观察信号的哪些特征使持久性景观的Lp规范增长。第4节介绍了我们对财务数据的发现,这些数据表明,持续性景观及其可变性的时间序列可以作为接近市场崩溃的新EWS。第5节总结了本文。2、BackgroundTDA使用拓扑结构从噪声数据集中提取信息。一个重要的步骤是分配拓扑不变量,这些不变量在考虑数据集的尺度发生微小变化时保持鲁棒性。

7
mingdashike22 在职认证  发表于 2022-5-31 06:14:43
当没有关于底层随机过程的信息时,这对于分析复杂系统尤其相关。本文使用的持久性同调方法允许计算所有尺度上的拓扑特征,并根据可以观察到这些特征的尺度范围对这些特征进行排序。这里我们简要介绍持久同源性,重点介绍我们直接使用的工具。为了进行严格的阐述,我们请感兴趣的读者阅读教科书。我们分析的输入数据是一个点云数据集,包括:,对于欧氏空间Rd中的一系列点X“tx,…,xnu。我们将拓扑空间与此类数据集关联如下。对于每个距离εa0,我们定义所谓的Vietoris-Ripsimplical complex,εq,或简单的Rips complex,如下所示:o对于每个k“0,1,2,…,顶点的k-单纯形txi,…,xiku是RpX,εq i的一部分,并且只有当其任何一对顶点之间的相互距离小于ε时,对于所有的xij,xilP txi,…,xiku,这是Pxij,xilqaε。如果我们认为ε是查看该数据的分辨率,那么对于与RpX,εq不可区分的每一组k数据点,k-单纯形都包含在RpX,εq中在分辨率水平ε上彼此。Rips简单复合物RpX,εq形成过滤,即RpX,εqDRpX,εqwhereεaε。对于每个这样的复合体,我们可以计算其k维同源性HkpRpX,εq,以及某些领域的系数。

8
大多数88 在职认证  发表于 2022-5-31 06:14:46
非正式地说,0维同调群HpRpX,εq的生成元对应于RpX,εq的连接分量,1维同调群HpRpX,εqq的生成元对应于RpX,εq中的“独立环”,2维同调群HpRpX,εqq的生成元对应于RpX,εq中的“独立腔”,等等,我们将只使用一维同调。作为ε级aloop的一个示例,考虑X中的一组4个点txi、xi、xi、xiu,使得距离dpxij、xij\'1qaε,对于j“0,…,3,j计算模4,但该集中没有其他一对点在ε的距离内。我们注意到,通过定义Rips复合体,我们不能有一个仅由3个点组成的循环。Rips复合体的过滤特性导致对每个k的相应同源物进行过滤,即HkpRpX、εqqDHkpRpX、εqq(每当εaε)。这些内含物终端规范同态HkpRpX,εqq~a~nHkpRpX,εqq,表示εaε。由于这个诱导映射族,对于每个非零k维同调类α,都存在一对值εaε,因此αP HkpRpX,εqq,但α不在任何HkpRpX的映像中,ε'δqq,对于δa0,α在HkpRpX中的映像,εqq对于所有εaεε都是非零的,但α在HkpRpX中的映像,εqqis为零。在这种情况下,有人说α在参数值bα处“出生”:“ε,在参数值dα处“死亡”“ε,或pbα,dαq对代表α的‘出生’和‘死亡’指数。点pbα,dαq的多重性αpbα,dαq等于在bα出生,在dα死亡的类α的数量。这种多重性是有限的,因为简单复合物是有限的。关于所有尺度上的k维同源生成器的信息可以编码在所谓的持久性诊断中ram Pk。

9
能者818 在职认证  发表于 2022-5-31 06:14:49
这种图包括:o对于每个k维同调类α,指定一个点zα“pbα,dαq P Rtogether及其重数|αpbα,dαq;o此外,pK包含R正对角线上的所有点。这些点表示所有在每个级别出生和立即死亡的平凡同源生成器;对角线上的每个点都有有限的重数。持久性图的轴是横轴上的出生指数和垂直轴上的死亡指数是例如,见图1。持久性图的空间可以被赋予度量空间结构。可以使用的标准度量是度p Wasserstein距离,其中pě1由WPPPK定义,Pkq“infφ>>–"yqpk}x'φpxq}p fif1{p,e=0e=e2e=e1e=e3e1e2e1e2e3e1+e22e2+e32l1图1:说明循环生灭的简单复合体的RIP过滤;1维持久性图和相应的持久性景观如下所示。其中,总和覆盖所有双射φ:Pk~nPk,and}¨}表示sup范数。由于持久性图包括对角线集,上述求和包括o个对角线点和Pk,Pk中的对角线点之间的点px,φpxqq。当p“8 Wasserstein距离被称为‘瓶颈’距离。持久性同源性适合分析噪声数据的一个显著特性是它在小扰动下的鲁棒性。非正式地说,该特性表示,如果基础浊点数据集只发生‘小’变化,则相应的持久性图只从t移动‘小’Wasserstein距离与未扰动数据相对应的持久图;见【22】。赋予Wasserstein距离的持久图空间P构成度量空间pP,Wpq。然而,这个度量空间是不完整的,因此不适合进行统计处理。

10
能者818 在职认证  发表于 2022-5-31 06:14:53
这给我们的目的带来了不便,因为我们想用统计工具研究持久性图的时间序列。为了解决这个问题,有几项工作致力于修改赋予的持久性图空间的结构,使其具有更合适的结构(例如,波兰空间或测地空间),或者将持久性图空间嵌入到函数空间。其中一种是基于持久性景观的嵌入,由Banach空间LppN^Rq中的函数序列组成;见[5,6]。我们现在定义了持久性景观。对于每个出生死亡点pbα,dαq P Pk,我们首先定义分段线性函数fpbα,dαq“$&%x'bα,如果x P'bα,bα';'x'dα,如果x P'bα'dα,dα;0,如果x R pbα,dαq.(2.1)为了避免混淆,我们在等式(2.1)中指出,通过pbα,dαq,我们表示端点为bα和dα的开放区间,而之前我们也用pbα,dαq表示坐标为bα和dα的点。对于由一定数量的o f-对角线点组成的持久性图PK,weassociate a sequence of functionsλ“pλkqkPN,其中λk:R~nr0;1s由λkpxq”k-maxtfpbα,dαqpxq | pbα,dαq p Pku(2.2)给出,其中k-max表示函数的第k个最大值。我们设置λkpxq“如果不存在第k个最大值,则为0。关于持久性景观的示例,请参见图1。因此,持久性景观形成了Banach空间LppN^Rq的子集。这由函数η”pηkqkě0的序列组成,其中ηk:R~nR表示kě0。该集合具有明显的向量空间结构,由pη`ηqkpxq“ηkpxq`ηkpxq”和pc¨ηqkpxq给出“c¨ηkpxq,对于所有x P R,和k”1,2,…当与范数}η}P“~255k”1}ηk}pp,1{P,(2.3)其中}pdenotes Lp范数,即}f}P“`R | f | P1{P,其中积分与R上的Lebesgue测度有关。在续集中,我们将只使用陆地地形。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 12:05