楼主: nandehutu2022
780 29

[量化金融] 高频金融数据中与时间相关的标度模式 [推广有奖]

11
可人4 在职认证  发表于 2022-5-9 03:11:19
我们观察到*(t) i始终围绕H的输入自相似值变化。由于EMD的边界效应,在该时间序列的开始和结束时可以观察到一些扰动[34]。在表2(b)中,我们报告了hhH*ii和H的标准偏差*(t) 。我们观察到与自相似参数H的良好一致性,但stdH的值较大*这可以归因于H*(t) 。我们注意到,对于标度指数H<0.3的fBm,hhR2ii系数很小,表明与方程7的标度定律存在显著偏差。当与估计的H进行比较时,我们得到了一致的结果*(t) 用广义赫斯特指数。此外,我们还考虑了长度较短的fBm路径,T=1000和T=500点,我们不报告这些结果,但我们注意到时间序列越长,标度分量H的估计越好。同样,标准偏差和8 fit的优度随着时间序列的长度而提高。然而,对于长度T=10000,所有结果与本文报告的结果一致α-稳定的L′evy运动(SLM)。这个过程是布朗运动推广到0<α的α稳定分布≤ 2.酶α=2对应于布朗运动。SLM是一个1/α自相似过程(H=1α),具有平稳和独立的增量[15]。类似地,将fBm扩展到α稳定分布就是线性分数稳定运动(LFSM),这是一种既表现出重尾又表现出序列相关性的自相似过程。当H>1/α时,LFSM的增量具有长程依赖性,当H<1/α时,LFSM的增量具有负相关性[15]。虽然α稳定的L’evy运动与H是自相似的∈ [1/2, ∞), lfsm的自相似参数在(0,1)中变化。

12
大多数88 在职认证  发表于 2022-5-9 03:11:23
有关这些过程的更多详细信息,请参阅[15]。我们使用[32]提供的工具箱生成了SLM进程,采样路径的长度为T=10384,生成的参数为M=128和M=6000,使得M(M+T)为2的幂,更多细节请参见[32]。我们考虑了H=1/α的情况下,H=0.5,0.55,0.95.图3(a)显示了模拟次数的时间相关样本平均值。我们观察到了一个比fBm更具噪声的估计器。在表3(b)中,我们报告了hhH*(t) 注意到自相似参数H的近似,对于H<0.7的过程,结果更好。测定系数的平均值表明,方程7的标度关系确实是令人满意的。我们将提出的估计值与q=1的广义赫斯特指数进行了比较,得到了一致的结果,即HG=1/α[35]。o阿菲玛。我们测试了方程7在FIMA(p,d,q)过程中与高斯新息p,q的对数线性关系∈ N、 分别为自回归系数和移动平均系数[31]。该模型是ARIMA(p,d,q)模型的扩展,允许差异指数d取分数,-1/2<d<1/2。两个参数H和d之间的对应关系由H=d+1/2给出。长程依赖的0<d<1/2区间对应于1/2<H<1[36]。我们考虑了ARFIMA(0,d,0)9t2000<H的简单情况*(t) >0.40.50.60.70.80.9(a)HH*GHE(1)hhH*二、stdH*hhR2ii hHGi标准差0。5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0指数H*(t) 平均接近值H=1α。

13
何人来此 在职认证  发表于 2022-5-9 03:11:26
曲线图显示了H的样本平均值*(t) ,表示为hH*(t) iand计算了m=1000个SLM模拟,自相似指数H=0.5,0.55,0.95(从下到上),长度T=10000点。b) H的样本平均值*(t) 随着时间的推移和模拟次数的增加,表示为hhH*ii,H的标准偏差*(t) 以及测定系数的样本平均值,R2.分数阶d=-0.4, -0.3, . . . , 0.4,长度T=10000。我们计算了H*(t) 用于综合ARFIMA时间序列。从图4(a)中,我们观察到估计量hH*i是指数H的良好近似值。在表4(b)中,我们报告了hhH*ii、H的标准偏差*(t) 以及测定系数的样本平均值hhR2ii。与fBm情况类似,H>0.3时的估计更准确,测定系数更接近1。通过对这三个不同过程的分析,我们观察到我们提出的方法对自相似参数产生了一个公平的近似。然而,让我们注意到,这个标度指数并不是用来估算H的替代方法,而是可以用更可靠的工具获得[11,37,38]。

14
可人4 在职认证  发表于 2022-5-9 03:11:30
该方法的目的是计算时间序列中普遍波动的时间相关振幅贡献,区分高频或低频对布朗运动的贡献大于或小于预期值的时段。10t0 2000 4000 8000 10000<小时*(t) >0.10.20.30.40.50.60.70.80.9(a)HH*GHE(1)hhH*二、stdH*hhR2ii hHGi标准差0。1 0.14 0.09 0.29 0.21 0.010.2 0.23 0.09 0.48 0.27 0.010.3 0.32 0.09 0.64 0.34 0.010.4 0.40 0.09 0.74 0.42 0.010.5 0.49 0.09 0.81 0.50 0.010.6 0.57 0.09 0.85 0.59 0.010.7 0.65 0.09 0.88 0.68 0.010.8 0.73 0.10 0.90 0.77 0.09 0.9 0.81 0.10 0.10 0.91 0.01(ARB)图4 0.90 0.90 0.80:0.84 0.0.0.0.01表示FIH指数为0,0.0.1.0.0.0.0.0.0.0.0.0.0.0.0.01的标度*(t) 平均值接近H=d+0.5。曲线图显示了H的样本平均值*(t) ,表示为Ash*(t) 在自相似指数H=0.1,0.2,…,的ARFIMA(0,d,0)的m=1000次模拟中,0.9(从下到上),长度T=10000点。b) H的样本平均值*(t) 随着时间的推移和模拟次数的增加,表示为hhH*ii,H的标准偏差*(t) 以及测定系数的样本平均值,R2.4.与时间相关的复杂性度量基于IMF振幅的平方定义一个与时间相关的香农熵类度量。该度量提供了复杂度的时变量化,为衡量金融时间序列中周期强度的标度指数提供了替代方法。利用方程4中描述的函数ak,我们将振幅的时间尺度相对分布定义为:pk(t)=a2k(t)nPk=1a2k(t),(8),其中n是不含残余的imf数。与Shannonentropy[39]类似,我们将依赖时间的复杂性度量定义为:*(t) =-nXk=1pk(t)ln pk(t)。(9) 等式9提供了振荡分量之间振幅分布的测量值。

15
大多数88 在职认证  发表于 2022-5-9 03:11:33
如果时间t的总振幅集中在一个振荡模式中,我们观察到一个较低的复杂度值,这意味着在时间t左右,该过程遵循一个普遍趋势。相反,如果所有的振荡模式都有相似的振幅,我们会得到一个更大的复杂度值,这表明一个更不稳定和不可预测的行为。因此,C*(t) 提供了一个随时间变化的紊乱评估,并能紧密适应我们对复杂性的视觉感知。此外,等式9比方差更能衡量一般的不确定性,因为后者测量的是平均值周围的离散度,而C*(t) 测量不同IMF周围的能量分散。与熵度量类似,如果一个imf支配过程的能量,则在时间t处提出的复杂度的值在零之间变化,如果能量在n个imf之间均匀分布,则在log(n)之间变化。等式8中振幅平方的权重选择是任意的,尽管它与其他熵的度量是一致的,例如[40]。我们测试了替代选择,如线性权重ak(t),获得了与本文报告的结果类似的结果。让我们注意到,尽管不是独立的,但这两个指标传达了不同的信息。估计量C*(t) 是一个不确定性的信息量化器,它是从振幅的分布中获得的,不考虑其时间尺度,它只量化成分的同质性。另一方面,标度指数H*(t) ,测量振幅在时间尺度上的变化,测试方程7中的标度律。恕我直言,H*(t) 是一种更严格的测量方法,假设振幅和周期之间存在对数线性关系。5.

16
可人4 在职认证  发表于 2022-5-9 03:11:37
金融市场的时间依赖性标度我们对四种股票指数的日内价格应用了建议的措施:(1)标准普尔500指数(美国),(2)IPC指数(墨西哥),(3)日经225指数(日本)和(4)徐100指数(土耳其)。我们特意选择了两个被归类为发达国家(美国和日本)的金融市场和两个新兴市场(墨西哥和土耳其),另外一个特点是,日本和土耳其的股票交易所有两个交易日,中间有午休时间。从彭博社获得的数据集包括每隔30秒记录的价格。从2014年1月15日到2014年6月16日,为期5个月。每个交易日的天数和数据点数量取决于每个证券交易所的开放时间。1215/01/14 13/02/14 17/03/14 15/04/14 15/05/14 16/06/14原木价格7。467.487.57.527.547.567.58(a)标准普尔50015/01/14/02/14/03/14/04/14 15/05/14 16/06/14原木价格10。5210.5410.5610.5810.610.6210.6410.6610.68(b)IPC15/01/14 13/02/14/03/14 15/04/14 16/05/14 16/06/14原木价格9。529.549.569.589.69.629.649.669.68(c)日经22515/01/14 13/02/14 14/03/14/04/14 15/05/14 16/06/14原木价格1111。0511.111.1511.211.2511.311.35(d)XU 100图5:2014年1月15日至2014年6月16日期间不同股票指数的30秒采样原木价格。(a) 标准普尔500指数(b)IPC指数(c)日经225指数(d)徐100指数。每个金融指数的对数图为5。表1显示了每个时间序列的天数和长度。国家指数天数标准普尔500 105 81900日本日经225 104 62400墨西哥IPC 101 7878780土耳其XU 100 106 78440表1:每个金融时间序列的天数和长度。H的时间演化*(t) 图6(深蓝色线)显示了五个月期间四项社会指数。

17
大多数88 在职认证  发表于 2022-5-9 03:11:40
我们注意到H*(t) 有13个较大的日内变化,很难识别较长时期内的任何趋势。因此,我们报告了H的移动平均值*(t) de标注为“H”*(t) (同一图中的浅蓝色线)。更具体地说*(t) 根据关系式“ak(t)2”计算∝ \'τk(t)2\'H*(t) 式中,ak(t)和τk(t)是一个交易日大小的滚动窗口上的平均值。此图中的虚线表示值H=0.5.15/01/14 13/02/14 17/03/14 15/04/14 15/05/14 16/06/14H*(t) 0.20.30.40.50.60.70.80.91小时*(t) \'H*(t) (a)标准普尔50015/01/14/02/14/03/14/04/14 15/05/14 16/06/14H*(t) 0.20.30.40.50.60.70.80.91小时*(t) \'H*(t) (b)IPC15/01/1413/02/1414/03/1415/04/1416/05/1416/06/14H*(t) 0.20.30.40.50.60.70.80.91小时*(t) \'H*(t) (c)日经22515/01/14 13/02/14/03/14/04/14 15/05/14 16/06/14H*(t) 0.20.30.40.50.60.70.80.91小时*(t) \'H*(t) (d)XU 100图6:2014年1月15日至2014年6月16日期间不同股票指数的时间相关标度指数。标度指数H*(t) 由深蓝色线条描绘。浅蓝色线代表“H”*(t) ,一个交易日的滚动平均值。红线表示H=0.5。(a) 标准普尔500指数(b)IPC指数(c)日经225指数(d)徐100指数。通过比较H的值*(t) 和“H”*(t) 对于四种不同的股票指数,我们观察到标准普尔500指数最接近14h=0.5,假设高斯分布将意味着BM行为,见图6(a)。在这个图中,\'H*(t) 在H=0.5左右波动,仅暴露出一些短暂的偏离。例如,我们可以检测到2014年2月左右的一段时间,在这段时间里,缩放参数会产生显著更大的值。在这段时间里,标准普尔500指数确实处于上升趋势,见图5(a)。

18
mingdashike22 在职认证  发表于 2022-5-9 03:11:44
因此,这表明,与纯随机行走相比,识别出的持续行为可归因于识别出振幅更大的长时间尺度循环。在图6(c)中,我们报告了日经225指数的标度动态。我们观察到*(t) 其值持续高于0.5,尤其是在分析期结束时。需要注意的是,该市场的午休时间会影响“H”的日内价值*(t) 。对于IPC指数,H的值*(t) 和“H”*(t) 始终接近H=0.6,而不是BM值H=0.5,见图6(b)。这表明IPC返回显示间隔,其中振幅显示持续行为。类似地,土耳其标度指数取大于H=0.5的值,见图6(d)。当应用于金融数据时,我们通过计算每次t的确定系数R2(t)来测试方程7的有效性。整个期间的平均值见表2第二列。我们还考虑了三个案例:H*(t) <0.45,约0.45<H的窗口*(t) <0.55和H*(t) >0.55。我们观察到,对于H来说,它的好处通常更好*(t) >0.5,当财务数据显示趋势行为时,有趣的情况见表2。索引hR2iAllhR2iH*<0.45hR2i0。45小时*<0.55hR2iH*>0.55S&P 500 0.8753 0.825 0.8716 0.8916IPC 0.8812 0.7971 0.8703 0.8915日经225 0.8072 0.7345 0.7829 0.8198XU100 0.9196 0.7987 0.8737 0.9209表2:不同金融指数的振幅与周期对数线性模型的平均优度系数(R2)。首先,计算所有时间t的平均值,然后分别计算H所在时间的平均值*(t) <0.45,0.45<H*(t) <0.55和H*(t) >0.55。为了进行比较分析,我们计算了复杂性度量C*(t) 由等式9描述。

19
nandehutu2022 在职认证  发表于 2022-5-9 03:11:47
每种金融股票指数的获得值1515/01/14 13/02/14 17/03/14 15/04/14 15/05/14 16/06/14C*(t) 00.511.52(a)标准普尔50015/01/14/02/14/03/14/04/14 15/05/14 16/06/14C*(t) 00.511.52(b)IPC15/01/1413/02/1414/03/1415/04/1416/05/1416/06/14C*(t) 00.511.52(c)日经22515/01/14 13/02/14/03/14/04/14 15/05/14 16/06/14C*(t) 00.511.52(d)XU 100图7:与时间相关的复杂性度量,C*(t) ,以获取2014年1月15日至2014年6月16日期间的不同股市指标。(a) 标准普尔500指数(b)IPC指数(c)日经225指数(d)徐100指数。如图7所示。标准普尔500指数(图7(a))的复杂度值总体上是四个指数中最大的。IPC指数显示C*(t) ,表明2014年初的振幅分布更加均匀,见图7(b)。相反,日经225指数呈现出复杂度的递减度量,表明在样本期开始时,复杂度较高,见图7(c)。最后,XU100指数呈现出高复杂度和低复杂度的交替区间,在样本期的最后两个月显示出规律性的大值。这种更高的随机性也可以从标度指数中看出,该指数显示相对较低的“H”值*(t) ,图7(d)。16总体而言,功能H*(t) C*(t) 朝相反的方向变化。对于每个市场,这两个指标之间的相关性为负值,ρS&P=-0.21,ρIP C=-0.23,ρ日经=-0.28,ρXU=-0.15. 我们注意到,这些相关值很小,表明这些变量之间存在弱线性依赖关系。这是可以预期的,因为基础测量与相当不同的属性相关。5.1. 标度模式的日内分析我们通过分离H的路径来研究日内模式*(t) C*(t) 进入日常窗口。

20
何人来此 在职认证  发表于 2022-5-9 03:11:50
以时间序列H为例*(t) 对于标准普尔500指数,图6(a),我们将该时间序列划分为构成数据集的then=105天,见表1。在图8(a)中,我们展示了这些每日时间序列(一天在另一天之上)。色条代表H的值*(t) 。这种图形表示法允许我们在一天中的特定时间比较交易时段并识别模式。我们估计了H的统计平均值*(t) 在交易日的每一个时间t,得出一个平均值。这个平均值表示为hH*(t) idays描述了H*(t) 在交易时段,参见图8(b)。为了验证观测到的hH动力学*(t) Iday统计意义重大,我们将这些动力学与标度指数H进行了比较*BM(t),从lengthequal的布朗运动到分析的金融时间序列的若干实现中获得,见表1。h的时间序列*BM(t)被分成n个等长的窗口。n天的平均值表示为hH*BM(t)艾迪斯。图8(b)中报告的粉色带对应于hH经验分布的第5和95个百分位*BM(t)由100次模拟计算得出。我们比较了H的值*(t) 通过hH获得每个财务指数*BM(t)idaysband。在交易时段的每个时间t,我们估计H的相对分数*(t) 不在粉色范围内的值。在图8(c)中,我们将这些结果报告为带外天数除以总天数的比率。这个比率被称为可能性。图中的颜色条表示平均缩放比例的值,即hH*(t) idays(图8(b)中绘制的值)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 10:23