楼主: 何人来此
1239 42

[量化金融] 多重分形扩散熵分析:最优的网格宽度 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-5 11:04:06
函数收集算法的说明。上图:a)1950年1月至2013年3月金融指数S&P500的时间序列,包含约16000个条目。b) 仅2008年标准普尔500指数的一个子集。c) 2008年前两个月的波动收集算法,s=8(s为1天)。该系列是部分整合的,也就是说,函数和σ(t)(在公式(11)中定义)被收集到右侧的直方图中。d) 2008年全年s=64(s为1天)的波动收集算法。该直方图独立于第一个直方图进行估计(对于每个直方图,分别应用Scott最优仓位宽度规则,在以下章节中进行了广泛讨论),因此,两个直方图的仓位宽度都是估计的。这是一个重新估计的问题,因此有必要为所有尺度找到一些共同的仓位宽度。时间序列S&P 500a)b)c)d)要遵循的波动收集算法。尽管它的适用性有限,人们仍然能够从这个方案中得出关于复杂多尺度数据集的分级行为的有价值的结论。感兴趣的读者可以在参考文献中找到FCA tonon平稳时间序列的一些概括。[25, 26].3.2. 单分形和多重分形扩散熵分析统计分形和多重分形不能用描述性统计指标(如均值或方差)来全面描述,因为它们确实以幂律的方式依赖于观察尺度。在文献中,我们可以找到许多方法,从经验数据序列中提取上述多重分形标度指数。例如,基于随机游动的去趋势波动分析[12,16],基于信号理论的小波分析[17],广义赫斯特指数[18],等等。

12
kedemingshi 在职认证  发表于 2022-5-5 11:04:09
在下文中,我们将采用另外两种方法来估算直接基于RE的标度指数,即Scafetta等人[19]的单分形扩散熵分析和Huang等人[20]和Morozov[21]的MF-DEA。选择这些方法的原因是,与使用的其他方法不同,扩散熵分析可以确定正确的标度指数,即使统计特性涉及异常或奇怪的动力学(例如,进化中的长程模式)。现代金融中的许多技术基本上依赖于一个假设,即被调查的随机变量遵循高斯分布。然而,在金融领域——以及在其他应用领域——P.Jizba和J.Korbel/Physica A 00(2018)1-22 6中观察到的时间序列往往偏离高斯模型,因为它们的边际分布是重尾的,甚至往往是不对称的。在这种情况下,普遍采用的正常假设的适当性非常值得怀疑。isoften认为,金融资产回报是大量信息和个人决策几乎连续及时到达的累积结果。因此,在存在重尾的情况下,可以很自然地假设它们近似地由一些(L’evy)稳定的非高斯分布控制。其他轻量级分布,包括Student\'s t、Weibull和双曲,缺乏吸引人的CLT特性。RE可以非常有效地处理现实世界复杂动力学中出现的重尾分布,例如生物或金融时间序列[8]。此外,正如我们已经看到的,RE有助于揭示潜在分布中存在的自相似性[27]。

13
大多数88 在职认证  发表于 2022-5-5 11:04:13
为了更好地理解RE在复杂数据分析中的作用,并进一步发展我们的研究,检查一些简单的模型情况是有帮助的。为此,让我们开始假设PDF p(x,t)具有通过简单的标度关系[25]p(x,t)=tδF编码的自相似性xtδ, (13) t是一个无量纲整数(比如N≥ 1) 通过计算相隔s个单位的计时器滴答声来测量经过的时间。或者,我们可以在(13)中使用分数t/s,而不是(无量纲)t,t和s都是满量纲。在后一种情况下,t和s将以秒为单位进行测量。例如,在高斯分布、指数分布或更一般的L’evy稳定分布中,这种标度是已知的。对于稳定分布,关系式(13)基本上意味着,当被理解为N个随机变量之和时,概率p(x,t)在一定比例因子下与单个变量的概率p(x,t)相同,即F(x)。这是分形行为的典型特征——整体看起来就像它的各个部分。操作提取标度系数δ的一种方法是使用差分(或连续)香农熵(t)=-ZRdx p(x,t)ln[p(x,t)],(14),因为在这种情况下,h(t)=a+δlnt,(15),a是一个与t无关的常数。所以δ可以从(t,H)平面上的对数lin图中解码。注意,对于布朗运动,这给出了δ=1/2,这意味着众所周知的布朗标度,对于(L’evy)稳定分布,是通过关系δ=1/u与L’evyu参数相关的δ指数。尽管上述单尺度模型捕捉到了许多涉及的基本动态,例如金融市场,但它们忽略了时间相关性的现象,而时间相关性反过来又会导致经验时间序列中遇到的长期和短期异质性。

14
能者818 在职认证  发表于 2022-5-5 11:04:16
这种相关时间序列通常不遵循中心极限定理,可以用反常的单标度指数或通过多重标度来描述。通常,在现实时间序列中,不同时间尺度下的标度指数不同,即对于每个大小的时间窗口(在固定的时间范围内),指数δ(s)对于不同的s通常有不同的值。为了避免技术困难,让我们考虑t=m·s,使m∈ N,也就是说,N可以被m整除。我们可以进一步假设,对于每个固定的时间尺度s,基本过程在统计上是独立的,因此时间范围t内的总PDF可以写成各自PDF的卷积,即p(x,s,t)=Zdmzδ十、-mXi=1zimYj=1sδ(s)Fzisδ(s), (16) 其中特别注意(16)可以被等价地重写为asp(x,s,t)=sδ(s)Zdmzδxsδ(s)-mXi=1zimYj=1F(zi)≡sδ(s)Gxsδ(s), (17) 这里s也是一个无量纲(时间)滴答计数变量,即整数。P.Jizba和J.Korbel/Physica A 00(2018)1-22 7其中g(x)=(F* F* ··· * F |{z}m次(x)。(18) 为了获得一个非平凡的尺度依赖性标度,我们假设PDF F(x)是L’evy稳定分布。为简单起见,我们将只考虑对称u稳定的L'evy分布,即形式分布,u(x)=2πZRdk exp-s | k |u(s)E-ikx=πZ∞dk cos(kx)exp-sku(s)=s1/微米(s)L1,微米xs1/u(s), (19) 其中s>0和u(s)∈ (0,2]分别是L’evy标度参数和L’evy稳定性指数。这允许用1/u(s)来识别δ(s),用L1,u(x)来识别F(x)。与单尺度情况类似,我们可以通过观察微分熵对时间尺度s的依赖性来确定具体的尺度依赖性。

15
何人来此 在职认证  发表于 2022-5-5 11:04:20
如第2节所述,单分形对应于q=1的情况,这也是1阶RE(即香农熵)在单分形DEA中发挥如此重要作用的根本原因。另一方面,在多重分形的情况下(如规模依赖分布的情况(16)),我们应该使用整类微分RE,definedashq(s,t)=1来代替香农微分熵- qlnZRdx pq(x,s,t)。(20) 以获得局部标度δ(s)。实际上,通过用(19)到(20)插入(16),我们得到HQ(s,t)=u(s)ln s+1- qlnZRdx Gq(x)=u(s)ln s+1- qlnZRdx Lqm,u(x)=u(s)lnt+1- qlnZRdx Lq1,u(x)。(21)由于Lq1,u(x)对于u<2的渐近行为(大体上|x |表现为1/|x |u+1),公式(21)仅对q>1/(1+u)具有良好的数学意义。极限情况u=2对应于高斯分布,对于任何q>0,高斯分布表现良好。我们可能会进一步注意到,在(21)中没有明确显示量表s,而是仅通过稳定性指数u(s)隐式反映。这是可以理解的,因为标度s不能直接观察到,而HQI原则上是一个可观察的量[28,29]。当时滞s很小时,可以预期Hqc可以从s解析地扩展∈ N+到s∈ R+。然后很容易检查0=总部(南、北)s=-u′sln tu(s)-q1- qRRdx(L1,u(x)/u)Lq-11,u(x)RRdx Lq1,u(x), (22)尤其是=总部(南、北)sQ→1= -u′(s)“ln tu(s)+ZRdx(L1,u(x)/u)ln L1,u(x)+1#= -u′“ln tu(s)+uZRdx L1,u(x)ln L1,u(x)#。(23)因为ErrRdx L1,u(x)ln L1,u(x)是u的单调递增函数(参见参考文献[30]——越细的L1,u越高的香农熵/无知),所以(23)中的导数项为正。

16
能者818 在职认证  发表于 2022-5-5 11:04:24
因为也在t≥ 0(请注意,t是一个整数)≥ 1) ,条件(23)表示u′(s)=0,或等效地表示u(s)为常数。这证实了之前的观察结果,即使用香农的微分熵可以很好地量化单分形时间序列。另一方面,当q,1时,我们也可以用一个非常数的标度指数来处理这种情况。这是可能的,因为[…]中的表达式q>1时可以为零。事实上,检查数字并不困难。Jizba和J.Korbel/Physica A 00(2018)1-22 8t=1t=2t=30.51.01.52.0t=1t=2t=30.10.20.30.40.50.61.05.02.03.01.5Μ=0.1Μ=0.2Μ=0.3Μ=0.1Μ=0.15Μ=0.21.02.53.02.01.5图2。方程(22)的解为函数q=q(u),且时间t恒定——图a)。图b)(对于u的小值)-或作为函数q=q(u)和常数t–图c),分别。图d)(对于较小的t值)。这些解决方案表明,在第节定义的多尺度模型中,哪些q具有检测非平凡多重分形标度的能力。3.2. 对数lin图中获得的曲线代表了适用于给定点的最佳多项式。所得到的曲线意味着q增长很快——比u的指数函数快,分别为t。另一方面,在t.ttuq qq qa)b)d)c)的小值下,指数依赖性是很好的。rrdx Lq1,u(x)是q<1u的单调递增函数,而对于q>1则不是。这反过来允许(至少在一段时间范围内)μ对q的非平凡依赖性。这在图2上描述。当然,事实上[…]=0本身并不排除u仍然是常数的可能性(如(23)所示)。如果是这样的话,时间序列将是单分形的,这是一个独立于q的声明,可以通过在q>1的几个总部查看来验证。

17
kedemingshi 在职认证  发表于 2022-5-5 11:04:28
如果单分形确实成立,那么可以通过香农熵进行进一步分析。无论是单分形还是多重分形,从(t,Hq)平面上的对数lin图可以提取所需的标度1/u(s)=δ(s)=δ(s(q))≡ δ(q)(参见参考文献[22])。通过认识到所考虑的(无量纲)时间变量t是以s为单位测量的,我们可以将(21)中的对数项写成-u(s)ln s+u(s)ln t,(24),其中s和t现在以(无量纲)秒为单位进行测量。通过将其与(7)进行比较,我们发现,对于非常小的时间滞后(比典型的自相关时间小得多),广义维数D(q)=δ(q)=1/u(q)。因此,我们的玩具模型系统清楚地表明了RE在多重分形谱分析中的重要作用,因为特定的q选择可以“突出”特定的时间尺度s。对于一般的异质性经验时间序列,如果我们能够评估感兴趣的RE分布和参数,问题仍然存在。例如,对于负q的情况是出了名的问题,因为对于支持无限的PDF,pq(x)的积分不收敛。当然,我们可以假设一个截断(或调节)模型,在这个模型中,我们可以指定支持的最小值和最大值。这在形式上有助于解决问题。Jizba和J.Korbel/Physica A 00(2018)1–22 9积分收敛,然而,关于PDF的时间依赖性,正确定义这种时间依赖性边界将是非常困难的,而且,这肯定会影响缩放行为。事实上,从信息理论的角度来看,应该避免使用负q的R’enyi熵。这是因为负q的信号解码(或信息提取)的可靠性被破坏(参见参考文献[22])。

18
kedemingshi 在职认证  发表于 2022-5-5 11:04:31
在下文中,我们将主要关注正值q。最后应该强调的是,与离散情况(7)相比,不同的q(t)不是(!)一般来说是积极的。特别是,比单位体积更为限定的分布的R’enyi熵小于单位体积上均匀分布的相应熵,因此产生负Hq(t)(参见参考文献[22])。概率直方图估计及其误差正如我们在前一节中所看到的,当试图估计标度指数δ(q)时,需要以直方图的形式为每个固定t指定潜在的概率分布p(x,t)。然而,多重分形是一种连续性。任何旨在验证时间序列多重分形特性的工具都面临着有限大小和离散化带来的困难,而任何旨在验证多重分形的技术都涉及一些插值方案,这可能会使其容易产生偏差。尤其是,从(未知)的基础p(x)中形成直方图时应小心,因为在基于RE的分析中,一个人不仅需要所有的^pi,还需要它们的功率,即:。,^pqi适用于不同的q值。在本节中,我们评估了当p(x)被其组织图取代时的误差,并概述了为了最小化重新估计中的误差,仓位大小h的最佳选择。我们从直方图及其属性的基本定义开始,然后分析不同q值的情况,最后推导出不同q.4.1值的最佳仓位宽度的明确公式。

19
能者818 在职认证  发表于 2022-5-5 11:04:35
histogramsLet的基本属性假设,我们从基本的PDF p(x)生成(例如,通过采样)一个具有某种固有仓位宽度h的直方图^p(x),即p(x)7→ ^p(x)=nBXi=1^pihχi(x)=Nh∞十一=-∞其中χi(x)是区间Ii=[xmin+(i)的特征函数-1) h,xmin+ih],nb是箱子的数量,^pi是时间t的实际采样值,而νi是采样计数,因此^pi=νi/N。在后一个等式中,我们正式将总和扩展到所有i∈ Z、 它将直方图的范围扩大到整个实轴,即低于xminandabove xmax。实际上,对于i<{1,…,nB}是νi=0。我们进一步注意到,料仓宽度h和料仓数量nB,namelynB之间存在简单关系=最大值- xminh, (26)在哪里十、 表示上限函数(即不小于x的最小整数)。取决于抽样的具体实现,即在序列{xi}Ni=1上,频率从1到N不等,频率等于k的概率等于N次试验后的二项式分布,每个概率为pk,其中pk=RIkp(x)dx,实际上,在大N极限^pk中→ pk。从这个角度来看,直方图代表了基本PDF的一类可能的近似值,我们进一步将其表示为H。所有直方图的H类包含分段常数函数,在每个长度间隔H中,它从集合{1/N,2/N,…,1}中获取值,并为每个这样的直方图分配了发生概率(由νk的概率确定)。因此,从样本数据{x,…,xN}构造直方图对应于从H类中选择一个特定的直方图。然后,直方图的q次方(重新估计所需)简单地表示为^pq(x)=NqhqnBXi=1νqiχi(x),(27),这是定义特征函数χi的简单结果。

20
大多数88 在职认证  发表于 2022-5-5 11:04:39
当然,我们的目标是创建这样的直方图,从某种意义上说,它将是底层分布的最佳表示,从而产生P。Jizba和J.Korbel/Physica A 00(2018)1-22 10重新评估中可能出现的最小错误。为此,有必要在未理解的PDF和采样的直方图之间找到一个适当的度量,该度量在计算上易于处理,并且在概念上具有良好的动机。然后需要解决的关键问题是,最佳箱子宽度是否与q无关,或者误差的最小化是否需要一些非平凡的q依赖性。下一小节将专门讨论用于测量基本PDF与其历史图之间距离(或差异性)的不同测量方法,以及随后的q依赖性问题。4.2. 直方图和概率分布之间的距离在统计估计问题中,概率分布之间存在许多不同的度量,其中Hellinger系数、Jeffreys距离、Akaike准则、定向散度及其对称性J-散度提供了范例。在基于RE的分析中,最自然的测量是^p与p的R^enyi信息差异。这被定义为[31]Dq(p||p)=q- 1lnZRdx^p1-q(x)pq(x)。(28)除了乘法预因子外,散度Dq(p | |^p)与顺序q的切尔诺夫概率距离一致(参见参考文献[32])。从信息论可知(例如,参见参考文献[8,22,31]),当PDF p(x)被PDF^p(x)替换(或近似)时,R^enyi informationdisference表示信息丢失的度量。注意,在极限q中→ 1.我们可以恢复通常基于香农熵的库尔贝克-莱布尔散度。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 13:42