楼主: nandehutu2022
1207 44

[量化金融] 超统计制度之间的过渡:有效性、崩溃和 [推广有奖]

11
能者818 在职认证  发表于 2022-6-1 03:27:23
这将有两个目的;a) 它将允许识别独特的尺度相关动力学的清晰定量特征,这可能代表统计制度之间的过渡,b)它将作为对通过下一小节中的超级统计方法获得的结果的独立检查。在分析股票价格的金融时间序列{Si}时,典型的关注量为对数回归SRI=对数Si+1Si。(5) 在我们的例子中,{ri}表示在采样时间τ=1分钟内股价对数的增量,这与记录股价的时间尺度相对应。最初,参考文献中引入了去趋势波动分析(DFA)。[42, 43, 44, 45, 46]. 随着发展,改进了该方法,参考文献[47]中提出了多重分形去趋势波动分析。许多论文讨论了MFDFA与时间序列分析替代方法的关系,如参考文献[48]及其引文。MFDFA通常是一种耗时的分析,需要高效地实现,以便能够以足够的精度调查大型数据集。这项工作中实施的方法是在REFS中开发的。[39, 40]. 特别是,数据集分为样本Xseg、wof固定大小s,其中w∈ {1,…,Ns}在每个样本中,局部趋势Xpro f,wis由一个固定阶的多项式o形成。我们计算趋势f2(s,w)=1ss的偏差样本方差i=1Xseg,w(i)- Xpro f,w(i)2.(6)第q阶波动函数定义为fq(s)=对于q,0,1Ns新南威尔士州=1F2(s、w)第二季度1/q,对于q=0,exp12纳秒新南威尔士州=1lnF2(s、w).(7) 4P。吉兹巴、J.科尔贝尔、H.拉维奇卡、M.普罗克、V.斯沃博达和C。

12
mingdashike22 在职认证  发表于 2022-6-1 03:27:26
Beck/Physica A 00(2017)1–21 5如果序列是长程幂相关的,则函数将显示幂律行为Fq~ sh(q)+n。这里h(q)代表广义Hurst指数,n∈ Z表示使用数据集的集成(正n)或派生(负n)进行初始预处理。进行预处理的原因是h(q)在接近0的区域中的位置,对于具有长程相关性的高斯噪声,它必须保持-12≤ h(q)≤另一方面,实际数据通常需要移动h(q)。在我们的例子中,我们没有预处理数据集,因此n=02。我们注意到,幂律可能不适用于s的整个范围,但它可能适用于分段,从而在一个区域内产生广义的dhurst指数。分析结果在定性上并不取决于DeTrending多项式的阶数o,见图2和图4。分析中存在微小的定量偏差,但它们不会干扰所给出结论的稳健性。如果存在上述Fq缩放,则ln Fq(s)将与ln s线性相关,h(q)表示斜率。单分形时间序列的特征是q的所有值都是唯一的h(q)。一般来说,h(q)与q无关。对于平稳时间序列,h(2)等于传统的赫斯特指数h。指数h(q)与经典相关指数τ(q)的关系为τ(q)=q·h(q)-1、具有长程相关性的单分形序列以τ(q)为特征,τ(q)与q呈线性相关,且具有单个Hurst指数H。多重分形信号具有多个Hurst指数H(q),τ(q)与q呈非线性关系。Hurst指数h(q)与奇异谱f(π)和相关指数τ(q)byf(π)=q(π)·π有关- τ(q(π)),(8)π=dτ(q)dq=q·h′(q)+h(q)。

13
nandehutu2022 在职认证  发表于 2022-6-1 03:27:29
(9) 这里π是H¨older–Lipschitz指数(或奇点强度),f(π)是以π的固定值为特征的子集序列的Hausdorff维数。多重分形谱提供了关于序列中各种分形指数的相对重要性的信息,例如,谱的宽度表示指数的范围。为了研究时间序列的内在特性,我们使用了通过对数据集进行随机化和随后傅立叶谱中相位的随机化而获得的shu’ed和替代数据集。我们定义了用于获得相关性和非线性特性的shu-free Hurst指数hshu Fqu和替代Hurst指数HshuRqt(有关更多详细信息,请参阅参考文献[39])。我们可能会注意到,我们的分析揭示了两个特征时间尺度的存在;a) 几十分钟,b)大约一百分钟。似乎还有更高的时间尺度——超过2500分钟,但我们在目前的分析中不考虑它们。3.2. 基于上一节阐述的超统计数据和补充材料【50】的分析认为采样间隔至少为20分钟是可靠的。此外,如【50】所示,该采样间隔对于所有七个时间序列都是足够的。因此,我们考虑构造为3r(20)j=20的新时间序列i=1r(最小)i+(j-1) 20,j∈{1, . . . , 编号:20}, (10) 在哪里··· 是FLOOR函数,N是每分钟采样的原始序列的长度。为了简单起见,我们在以下上标中禁止显示时间序列的刻度,除非另有说明,否则仅使用20分钟的刻度数据。

14
kedemingshi 在职认证  发表于 2022-6-1 03:27:32
文献[18]中没有进行此类调整,这可能是结论略有不同的原因。有了可靠的数据,下一步就是确定密集参数保持不变的时间间隔。在这里,我们遵循参考文献[18]中提出的方法,即我们估计不同窗口长度的对数回报峰度,然后选择最佳块宽度Top,其中所有窗口的平均峰度κ为参考文献中的2。[47,49]他们使用积分来改进广义赫斯特指数的估计,因此他们设定n=1.3注意,当改变到更高的时间尺度时,对数返回r是相加的。5便士。Jizba,J.Korbel,H.Laviˇcka,M.Prokˇs,V.Svoboda和C.Beck/Physica A 00(2017)1–21 6101102s,o=210-410-310-2Fq(s)q=0.0q=1.0q=2.0q=3.0q=4.0q=5.0q=6.0q=7.0q=8.0q=9.0q=10.0101102s,o=3101102s,o=4101102s,o=5预测流动分析图1。DFA对AA公司4个不同DFA订单的日志返回进行分析。除了短期(少于20分钟)外,Fq的行为非常健壮。所描绘的图为对数-对数比例图。0 2 4 6 8 10q-0.4-0.20.00.20.40.60.81.0Hq0 2 4 6 8 10qo=2o=3o=4o=5广义赫斯特指数图2。AA公司在2个不同时间尺度上的对数收益的广义赫斯特指数作为q的函数。相应的时间刻度为20- 100分钟(左图)和150分钟- 500分钟(右图)。6便士。Jizba,J.Korbel,H.Laviˇcka,M.Prokˇs,V.Svoboda和C.Beck/Physica A 00(2017)1–21 7101102s,o=210-410-310-2Fq(s)q=0.0q=1.0q=2.0q=3.0q=4.0q=5.0q=6.0q=7.0q=8.0q=9.0q=10.0101102s,o=3101102s,o=4101102s,o=5趋势波动分析图3。DFA对BAC公司4个不同DFA订单的日志返回进行分析。

15
大多数88 在职认证  发表于 2022-6-1 03:27:35
除了短期(少于20分钟)外,Fq的行为非常健壮。所描绘的图为对数-对数比例图。0 2 4 6 8 10q-0.20.00.20.40.6Hq0=2o=3o=4o=5广义赫斯特指数图4。广义赫斯特指数作为2个不同时间尺度下BAC公司对数收益的q函数。相应的时间刻度为20- 100分钟(左图)和150分钟- 500分钟(右图)。7便士。Jizba,J.Korbel,H.Laviˇcka,M.Prokˇs,V.Svoboda和C.Beck/Physica A 00(2017)1–21 85 10 15 20 25 30 35 401.52.53.03.54.0关于窗宽公司KOκTT窗宽的平均峰度图5。寻找最佳块宽度,ε=0.1。最接近正常PDF之一,即κ=3。作为峰度的有偏矩估计,我们使用^κ=m4m22=1TTi=1(ri- (R)r)41吨i=1(ri- (R)r)22,(11)其中,r是给定时间窗口内日志返回的样本平均值。除了作为标准估计器外,(11)对于正态样本的均方误差最小,参见参考文献[38]。因为我们最终对方差的分布感兴趣,所以我们更喜欢方差的数据点,每个块中估计方差的准确性是次要的,因为在密度估计中误差相互抵消。因此,我们引入了一个小的阈值ε,并将最优T视为平均峰度κTover n=不适用 块满足度- 3| < ε . (12) 我们选择的阈值为ε=0.1,这确保了样本方差序列尽可能长,而不会显著偏离κ=3,见图5。对于不同尺度上方差分布的后续比较,可以方便地将对数回归标准化为零均值和单位方差,即eui=ri- 其中,r和S2分别是整个系列的样本均值和样本方差。

16
可人4 在职认证  发表于 2022-6-1 03:27:38
在具有最佳窗口宽度和归一化对数回报的情况下,我们使用无偏估计器2j=1(顶部- 1) 顶部i=1ui+(j-1) 顶部- uj2,j∈1.N/顶部. (14) 这里,N是每20分钟采样的新系列的长度,并且ujdenotes样本在特定块中的平均值uj=1TopTopi=1ui+(j-1) 顶部。(15) 通过此程序,我们获得N/顶部方差值(或物理术语中的“温度”),然而,在超级统计中,我们需要“逆温度”{βi}[c.f.公式(2)],即βi=1s2i。(16) 8便士。Jizba,J.Korbel,H.Laviˇcka,M.Prokˇs,V.Svoboda和C.Beck/Physica A 00(2017)1–21 9图6中描述了获得反向温度值的程序。下一步是找到β的混合PDF。这项任务通常相当复杂,但我们可以利用这样一个事实,即在超统计学中,只有三个两参数的泛混合分布族被认为是相关的。这些是伽马分布、对数正态分布和反伽马分布。因此,我们面临着一个更容易处理的任务,即在有各种方法可用的情况下进行参数拟合,其中最主要的是最小距离法、矩法或最大似然法。在这里,我们采用最大似然法,以避免干扰用于拟合优度的距离度量。当找到最佳参数时,我们可以询问三种PDF中哪一种是混合PDF的最佳PDF。拟合优度通常通过预期分布和经验分布之间的距离来衡量。

17
何人来此 在职认证  发表于 2022-6-1 03:27:41
这里我们展示了三个原型距离,即Kolmogorov–Smirnov距离DN=supx | Fn(x)- F(x)|,(17)Cram'er–von Mises distanceCn=n+∞-∞[Fn(x)- F(x)]2dF(x),(18)和Anderson–Darling distanceAn=n+∞-∞[Fn(x)- F(x)]2F(x)[1- F(x)]dF(x),(19),其中F(x)是完全指定的预期分布(即给出了其所有参数),Fn(x)是经验分布Fn(x)=1nni=1I(ui≤ x) ,(20)式中,I(······)是指示器功能。相应的拟合优度统计检验利用这些距离来检验数据来自给定分布F(x)的假设。严格地说,ACF对β的强烈依赖性(见图7),使得使用标准程序和通过这些方法测试拟合优度是不必要的。然而,即使对于相关数据,也有必要将上述距离视为一种方便的工具,以区分三种PDF。因此,我们的策略是计算每个公司在特定规模下的距离,并选择距离最小的PDF作为该规模下的最佳混合PDF。由于每个距离度量值都有其特定的属性,因此不同的距离会产生不同的结果也就不足为奇了。然而,我们的分析表明,所有七个时间序列的结论都非常稳健,并且对所采用的距离度量不太敏感。在选项卡中。1我们使用AA数据集来说明三种混合PDF的距离度量。数值对应于20分钟刻度,如前所述,这是最小的可靠刻度。我们可以从表中得出结论。1(参见图8)对于小时间尺度,最好的超统计是-0.02-0.010.000.010.02log-返回150 100 150 200S12S22S32S42时间索引图6。温度估算程序示意图。9便士。吉兹巴、J.科尔贝尔、H.拉维奇卡、M.普罗克、V.斯沃博达和C。

18
可人4 在职认证  发表于 2022-6-1 03:27:44
贝克/Physica A 00(2017)1–21 1050 100 150 2000.00.20.40.60.81.0∝ t型-γt- 时间滞后图7。AA公司在20分钟尺度下的β自相关函数。最佳γfit提供γ=0.377。记录正常值。这与【18】中的说法是一致的,该说法仅通过直方图和拟合分布的可视化观察得到支持。事实上,【18】的主要观点是表明在不同的时间尺度上观察不同的超统计是可能的。通过在两个遥远的时间尺度(即分钟尺度和日尺度)上拟合β的PDF,证明了这一想法。选项卡。2以更定量的方式支持这一观点,我们确实看到了一个转变,至少对于AA公司来说,从小规模的对数正态分布转变为日常规模的伽玛分布。为了更好地了解过渡,可以方便地计算两个以上时间尺度的统计距离,并查看距离相对于观察到的时间尺度的表现。我们计算了从20分钟到500分钟的缩放距离~ 1个交易日(对于更高的规模,需要更多的数据)。AA的短时标度结果如图所示。8和9,从中我们可以看出,只有在很短的时间内,对数常态制度才占上风。不幸的是,这种粗糙的方法不允许非常可靠地确定过渡点,因为当单个距离度量值彼此接近时,应考虑其各自的特性,并且不能将实际值的简单比较视为决定性标准。然而,在图10中,我们可以看到大约400分钟的时间,我们可以可靠地宣称,超级统计的变化已经非常显著。上述分析以及获得的结果定量地支持了参考文献[18]中针对AA公司的观察结果。

19
nandehutu2022 在职认证  发表于 2022-6-1 03:27:48
然而,根据【18】所述,超级统计学的转变应该出现在所有七家被分析的公司中。从图中可以清楚地看到,情况并非如此(至少对于观察到的时间尺度而言)。11和12(参见补充材料[50]),其中安德森-达令距离度量为公司BAC显示(其余两个距离度量得出相同的结论)。对数正态状态即使在长时间尺度上也会持续,并且没有观察到超统计的过渡。这当然不排除在更长的时间尺度上存在过渡,但清楚地揭示了对拟合直方图进行目视检查的缺点。对数范数Gamma Inv GammaKolmogorov–Smirnov 0.032 0.050 0.117Cramer–von Mises 1.26 3.04 22.06 Anderson–Darling 8.57 16.18 121.88表1。三种混合PDF的各种距离测量值,AA公司,标度为20 min.10P。Jizba、J.Korbel、H.Laviˇcka、M.Prokˇs、V.Svoboda和C.Beck/Physica A 00(2017)1–21 110.020.040.060.080.100.12Kolmogorov-斯米尔诺夫距离,AA20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 140 145 15005101520公司-von Mises distance,公司AA20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 15002040608010120Anderson-Darling distance,公司AA20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 15005101520 30 40 50 60 80 100 120 130 140 150012320 30 50 60 70 80 90 100 120 140 150图8。AA数据集:所考虑的超统计混合PDF的三个统计距离度量显示为20分钟到2.5小时(150分钟)区间内时间尺度的函数。

20
能者818 在职认证  发表于 2022-6-1 03:27:51
蓝色:Inv Gamma分布,绿色:Gamma分布,红色:对数正态分布。051015安德森-Darling distance,公司AA20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150图9。AA公司安德森-达令距离测量的详细信息。考虑的时间范围为20分钟至2.5小时(150分钟)。绿色:伽马分布,红色:对数正态分布。反伽马分布是偏远地区,为简单起见,不包括在内。事实上,【18】的作者承认,区分不同的超级统计学绝非易事,从图中可以清楚地看出这一点。10和12,我们看到对数正态分布和伽马超统计之间的距离非常接近。部分原因还在于,对于更高的时间尺度,我们的“逆温度”β数据点较少,因此统计距离在区分两种概率分布方面的统计能力较小。总计我们分析了7家公司(其余5家在补充材料[50]中报告),其中四家公司,即AA、INTC、KO和WMT,显示了超统计之间的过渡。另一方面,BAC、GE和JNJ公司在考虑的时间尺度上没有表现出超统计的过渡。有趣的是,参考文献[19]中得到了非常相似的分类,其中,借助符号空间中的Renyi熵来研究相同的时间序列。对数正态伽马Inv GammaKolmogorov–Smirnov 0.077 0.045 0.133Cramer–von Mises 0.153 0.032 0.770Anderson–Darling 1.151 0.255 4.590表2。AA公司三种混合PDF的各种距离测量值的范围为390分钟(大约1个交易日)。11便士。吉兹巴、J.科尔贝尔、H.拉维奇卡、M.普罗克、V.斯沃博达和C。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 11:36