楼主: mingdashike22
2723 87

[量化金融] 金融时间序列的熵分析 [推广有奖]

31
能者818 在职认证  发表于 2022-6-10 07:47:29
结合平稳分布的表达式,具有平稳分布π和转移矩阵Pijc的平稳马尔可夫过程的熵率可以简化为:h∞=Xiπi·Xj-Pij·logPij!(2.23)2.3.4熵的大小为了测量由于传递熵而产生的信息增益量,我们遵循Marschinski和Kantz(2002),根据REA(添加的相对解释)度量将信息增益与这些序列的熵联系起来,定义如下:REA(m,l)≡泰→X(m,l)H(X | X-1.十、-(m) )(2.24)在这里,由传递熵测量的从Y到X的信息流与基于X的条件块熵的信息总流相关。不同的是,它通过在已经观察X时观察X和Y的历史来测量额外的信息增益。使用传递熵的定义,wearrive在以下形式下(m,l)=H(X | X-1.十、-m、 Y型-1.Y-l) H(X | X-1.十、-m)- 1(2.25)如果Y的过去历史没有为预测X添加信息,则h(X | X-1.十、-m、 Y型-1.Y-l) =H(X | X-1.十、-m) REA为零。为了了解REA的预期水平,我们直接引用了Marschinski和Kantz(2002)的结果。使用DAX预测道琼斯工业指数(Dow JonesIndustrial)的REA(使用一分钟的刻度数据)估计为3 symboldiscretization的0.4%。2.4近似熵(ApEn)引入了各种信息度量,以补充我们对随机时间序列的理解。在一系列文章中,Pincus(1991)开发了一种新的基于近似熵的数学方法来测量时间序列中的规律性。2.4.1定义u是一个数字序列,u(1)。u(N),长度为N。给定一个非负数字m和m≤ N、 我们形成子序列x(i)的m-块≡ (u(i),u(i+1),u(i+m-1)).

32
mingdashike22 在职认证  发表于 2022-6-10 07:47:32
用d(x(i),x(j))测量两个块之间的距离≡最大值=1,2,。。。m(| u(i+k- 1) - u(j+k- 1) |),因此它是块体之间点位差异的最大值。给定一个正实数r,我们计算给定块x(i)距离小于r的块x(j)的分数,并将其命名为Cmi(r)。公式(2.26)给出了形式定义,其基于Pincus(1991)、Pincus(1995)、Pincus和Huang(1992)等。Heaviside函数Θ计算距离d低于阈值r的实例:Cmi(r)=N- m+1N-m+1Xj=1Θ(r- d(x(i),x(j))(2.26)Φm(r)=N- m+1N-m+1Xi=1logCmi(r)(2.27),方程式(2.27)中定义了Φm(r),近似熵ApEn(m,r,N)定义为:ApEn(m,r,N)(u)=Φm(r)- Φm+1(r),m≥ 0(2.28)ApEn(0,r,N)(u)=-Φ(r)(2.29)ApEn(m,r,N)始终定义良好。在方程式(2.26)中,当块的分数<r时,始终计算块与自身的距离d(xi,xi)。So Cmi(r)≥ 因此,Cmi(r)的对数永远不会确定。以下扩展说明ApEn衡量特定模式的接近程度。-ApEn(m,r,N)(u)=Φm+1(r)- Φm(r)=N- 明尼苏达州-mXi=1logCm+1i(r)-N- m+1N-m+1Xi=1logCmi(r)≈N- 明尼苏达州-mXi=1logCm+1i(r)- logCmi(r)=N- 明尼苏达州-mXi=1日志Cm+1i(r)Cmi(r)(2.30)最后一行是所有m区块上| u(j+m)条件概率对数的平均值-u(i+m)|<r,假设| u(j+k)-u(i+k)|<r对于所有k=0,1。m级-因此,近似熵衡量的是一种对数可能性,即m个观测值接近的模式序列在下次比较时保持接近。ApEn衡量持久性、相关性和规律性。如果Cm+1i(r)等于Cmi(r),则ApEn=0,并且存在强序列依赖性。因此,ApEn值越低,持久性和自相关性越高。

33
nandehutu2022 在职认证  发表于 2022-6-10 07:47:35
ApEn值越高,意味着持久性越差,观察结果越独立。图2.4:AR(1)过程的ApEn。具有各种自回归系数ρ=0,…,的AR(1)过程的近似熵ApEn(N=200,m=1),0.9.我们可以导出近似熵的另一种有用表示。我们已经在方程(2.30)中表明,m=1的近似熵ApEn(m=1,r,N)可以重新表示为两个块在扩展一个元素时保持闭合的预期对数似然。假设随机过程的平稳性,我们可以减少ApEn(m=1,r,N)中的计算数量,如下所示:ApEn(1,r,N)(u)=Φ- Φ(2.31)(2.30)=-N- 1N-1Xi=1logCi(r)Ci(r)(2.32)N→∞=- E日志C(r)C(r)(2.33)此外,Pincus(1991)发现了许多过程中ApEn的分析表达式。对于iid分布随机变量,ApEn(m,r)由以下定理给出。密度函数为f(x)的iid过程的定理,对于任意m,ApEn(m,r)=-Zf(y)·日志Zz=y+rz=y-rf(z)dzdy(2.34)例如,考虑一阶自回归过程AR(1),如下:Xk=ρ·Xk-1+ kk=0、1、2。(2.35)对于ρ=0,0.1。0.9,绘制了长度为200的1000条路径的蒙特卡罗模拟。图2.4描述了产生的带有标准误差的近似熵估计。对于较高的相关值ρ,近似性较低。最大ApEn值适用于ρ=0的随机游走过程。对于ρ=0.9,ApEn下降至0.65[位]。这表明持久性是近似熵测度敏感的特征。2.4.2 ApEn估计Rukhin(2000)表明,ApEn渐近收敛到N的卡方分布→ ∞. 特别是对于大小为N、块大小为m和常数为c的iid二元值序列=-3ln2,ApEn(m,N)与m收敛为χ分布-2自由度为N→ ∞.

34
可人4 在职认证  发表于 2022-6-10 07:47:38
对于有限样本,ApEn是一个有偏差的统计数据。小样本偏差可以用一个正态分布的随机变量N(0,σ)来说明,样本长度从20到500不等,每个都有1000条模拟路径。图2.5右侧显示了该随机游动的ApEn估计值的平均值和标准误差。阈值r设置为样本标准偏差的20%。随着样本长度N的增加,ApEn的平均值从(m=2,r=0.2σ,N=20)=0.11[位]增加到(m=2,r=0.2σ,N=500)=1.44[位]。对于小样本,ApEn的低估是显而易见的。我们可以从图2.5中看到,随着样本长度接近1,ApEn接近0。鉴于这种小样本偏差,可以增加阈值r作为一种反措施。但有一个更大的r,分布中的信息丢失了。小样本偏差还意味着,只有当样本长度N相同时,ApEn之间的比较才有意义。此外,Pincus(2008)研究了各种股权指数的ApEn(m,r,N),得出结论,参数m=1,2和过滤阈值图2.5:ApEn与m=1,5和N=20。左:滚动90天窗口(m=1,…5,r=0.2^σ)(SP500)时间序列。右图:不同样本大小和标准误差的随机游动的估计ApEn图。0.1^σ ≤ r≤ 0.25^σ,其中^σ为样品的标准偏差,可产生良好的结果。为了构造统计界,第五章采用了自举方法。bootstrapping方法通常涉及多次重新整理数据,并使用bootstrapping模拟中平均的近似熵估计来估计偏差和计算有效ApEn。然而,重新处理数据也会破坏单变量时间序列内的相关性。

35
大多数88 在职认证  发表于 2022-6-10 07:47:41
更接近的方法是标准的块引导,其中使用固定块长度的块重采样。这就是这里采用的方法。在图2.5中估计随机行走的开放度时,引导标准误差显示为图中ApEn估计值周围的灰色带。样本长度越小,标准误差越大。第三章提款的双变量分析在本章中,我们使用互信息和传递熵来分析欧元/美元和英镑/美元的大额提款/提款之间的依赖关系。尽管我们的样本期间记录了各种危机事件,但我们没有发现这种货币对存在极端依赖。欧元/美元和英镑/美元的大额支取/支取依赖性较弱。然而,转移熵显示了欧元/美元和英镑/美元之间的信息流。3.1简介金融时间序列提取(提取)定义为从本地最大值(最小值)到下一个本地最小值(最大值)的累积回报。绘制是一种时间序列功能,它包括提取和提取,没有规则的时间戳。它提供了不同市场制度的统计依赖性方面。提款的概念很重要,不仅从理论角度来看,而且在金融行业的各种情况下也很重要,例如在资产管理中,提款往往会推动赎回。对于受按市值计价限制的买入并持有投资组合,延长提款期可能会导致不必要的清算和投资组合的重新调整。此外,大额提款可能通过投资组合保险和基金转售触发反馈机制,这有可能推动价格进一步下跌。

36
何人来此 在职认证  发表于 2022-6-10 07:47:44
对提取的研究已经引起了相当大的关注,并记录了金融时间序列中提取的许多经验特性。Johansen和Sornette(2001)提出了一个崩溃理论,该理论解释了几乎所有时间序列都适用的下降/上升。他们声称,下降/上升可以用一个定义明确的微观结构过渡阶段的开始来解释,该阶段的特征是每天下降的突然持续出现,加上下降的相关幅度增加。这就解释了为什么价格变化在大多数情况下似乎是独立的,但在特殊情况下,可能会出现连续的相关性和放大效应,从而产生提取/提取异常值。据我们所知,尚未对金融时间序列中的提取(提取)关系进行研究。Rebonato和Gaspari(2006)在个案基础上对美国不同到期日利率的大额提款/提现是否相互一致进行了定性研究。但到目前为止,尚未提出定量措施来分析这些提取/提取。检测和衡量金融时间序列之间的相互作用是金融和经济学研究的一个关键领域。关于线性依赖,例如,向量自回归模型中存在相关和互相关度量及其更一般的公式。最近,copula方法被用来模拟时间序列之间更一般形式的依赖关系,并取得了一定的成功(McNeil、Frey和Embrechts(2005))。但是,这些工具不适合对提取/提取的依赖性进行建模。从返回到绘图时出现的一个障碍是时间被压缩,并且不再等距分布。

37
kedemingshi 在职认证  发表于 2022-6-10 07:47:47
与同步测量的时间序列不同的是,两个时间序列产生的绘图通常会进行非常不同的计时。另一个障碍是,经常有人认为,大规模下降/上升是由非线性机制产生的。市场参与者对市场状况压力不足的羊群效应、投资组合保险的积极反馈以及市场压力时期的流动性波动都会导致非线性价格动态(Sornette(2003))。作为标准模型的替代方案,信息理论方法已成功应用于金融和其他领域,以应对上述问题。特别是,传递熵测量序列之间的信息流,并检测序列之间的细微依赖关系。这是一个基于传递概率的Kullback-Leibler距离(Schreiber(2000))的无模型度量。另一方面,互信息是时间序列的数量相关性和互相关类型相关性。它还广泛用于金融领域(戈兰(2008)、迪奥尼西奥(Dionisio)、梅内泽斯(Menezes)和门德斯(Mendes)(2004))。在本章中,我们使用信息论工具分析欧元/美元和英镑/美元的大额提款和大额提款是如何相互关联的。具体而言,交互信息度量用于分析同期相关性(即同一小时或同一天)或特定时滞。转移熵用于测量一个时间序列中的大量下降和上升对另一个时间序列中的大量下降和上升的影响。我们的结果表明,欧元/美元和英镑/美元的大额提款之间的关系弱于依赖关系。有关更多详细信息,请参见Tsay(2010)。例如,参见Marschinski和Kantz(2002)、Kwon和Yang(2008b)、Jizba、Kleinert和Shefaat(2011)。在相同序列的返回之间。

38
nandehutu2022 在职认证  发表于 2022-6-10 07:47:49
当考虑序列之间的时滞时,依赖性的强度显著下降。另一方面,转移熵表明两个系列中的大抽签之间存在信息流动。这种信息溢出效应从英镑/美元到欧元/美元略强于反向。本章结构如下。第3.2节回顾了与分析相关的文献。它涵盖了关于提取/提取的主要研究以及熵测度和信息理论工具的一些最新金融应用。第3.3节描述了使用的数据并讨论了其统计特性。第2章介绍了本研究中使用的各种信息论工具,第3.4节简要回顾了这些工具。本节还介绍了将图纸转换为符号序列的方法。第3.5节介绍并讨论了相关性分析的结果。我们在第3.6节中进行了总结,并提出了未来研究的可能方向。3.2相关文献3.2.1提取文献在Johansen、Ledoit和Sornette(2000)提出的微观结构模型中,代理人在正常和危机市场条件下做出不同的反应,在市场反弹和崩盘期间产生不同的模仿、羊群效应和正反馈模式,留下不同的“自相关性”和依赖性特征。作者声称,提款中的异常值始于突然出现和持续的每日价格下跌,再加上下跌的相关幅度增加。因此,在“正常”市场条件下,价格变化在大多数时间内似乎是独立的,但在特殊情况下,可能会出现连续的相关性和放大效应,从而产生下降异常值。给定一个时间序列,下降被定义为连续的负回报序列。

39
大多数88 在职认证  发表于 2022-6-10 07:47:52
因此,提款被定义为一系列不间断的积极回报。具体而言,提取(drawup)是从一个本地最大值(最小值)到下一个本地最小值(最大值)的累积回报。对于本章的其余部分,除非另有说明,我们通常使用提款来指代提款和提款。正如Johansen、Ledoit和Sornette(2000年)以及Johansen和Sornette(2001年)所述,Draws在Sornette的理论中,在捕捉不同市场制度下的市场依赖性方面发挥着重要作用。继Johansen和Sornette(2001)之后,从特定长度的下降开始,观察到D级下降持续n个时间单位的概率与topn(D)成正比∝Z-∞dxp(x)···Z-∞dxnp(xn)δD-nXi=1xi(3.1)其中δ是δ函数,δ(D-方程(3.1)右侧的Pni=1xi)确保总和在所有可能的运行持续时间n上∈ N- {0}.由于水位下降原则上可以持续任意数量的时段,我们需要将所有可能的持续时间相加,以得出水位下降的概率,其大小取决于n,如下所示:p(D)=pupd∞Xn=1Z-∞dxp(x)···Z-∞dxnp(xn)δD-nXi=1xi(3.2)其中pd=R-∞p(x)dx是观察到负价格变化的概率,pu=1- Pd是正的对应项,而术语pupden则确保了分布的正态性。通过渐近分析并假设iid回报,水位下降概率密度函数p(D)的分析表达式具有指数分布(Johansen和Sornette(2001)):p(D)=Dexp(-|D | D);D=-pupdZ公司-∞xp(x)dx(3.3)δ是一个带r的函数+∞-∞δ(x- a) f(x)dx=f(a)dha是水位下降特征尺寸的自然解释。Sornetteet等人。

40
大多数88 在职认证  发表于 2022-6-10 07:47:56
将指数分布扩展到下面方程(3.4)中的拉伸指数分布,以使用渐近分析中泰勒级数展开中的额外项来解释较慢的衰减尾:Pse(D)=De-(| D |χ)z(3.4)方程(3.4)可以拟合峰度小于(z>1)或大于(z<1)的分布,而不是简单的指数分布。参数z和χ简洁地描述了分布:χ值越大,“典型”水位下降越大;z值越小,尾部越厚,出现较大水位下降的相对可能性越大。Rebonato和Gaspari(2006)表明,对于相同和独立的高斯回报,预期的下降幅度为E[D]高斯=4σ√2π,adraw内的预期日降d,E[d]高斯=2σ√2π.与提取和提取密切相关的概念是运行,定义为一系列正(或负)价格变化。Mood(1940)和其他人获得了关于arun长度(与抽签持续时间无关)的结果。我们用ld表示运行或下降的长度。任意选择的支取正好由ld=n个价格变动组成的概率可以计算为给定初始下移,进一步n个价格变动的概率-1步和结束上移如下:P(ld=n)=pu·pn-1d(3.5),其中pu为上移概率,pd为下移概率,pu+pd=1,返回序列{x,…xn}。应用Mood(1940)更一般的结果,可以计算n个价格变化时间序列中的预期运行次数E【Nrun】。这是givenasE[Nrun]=2npu(1- pu)+pu+(1)- pu)(3.6)对于普通硬币,pu=pd=,因此预期的运行次数为E[Nrun]=2n++=n+1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 01:10