楼主: 可人4
2586 98

[量化金融] 强相关时间序列的记录统计:随机游动和 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-31 03:15:40
(x+N- 1) =NXM=1纳米xM,(11)其中无符号斯特林数纳米枚举具有正M个不相交循环的n个元素的置换数。因此,一个搭扣(M | N)=N!纳米, (12) 这表明,N个i.i.d.随机变量的记录数是分布的,就像N个具有统一测度的对象的随机置换中的循环数一样。最后,利用斯特林数的渐近行为,可以证明当N→ ∞, 高斯分布p(M | N)≈√2πln Nexp-(M)- ln N)2 ln N. (13) 这里我们讨论了随机变量是连续随机变量的情况。我们请读者参考参考文献[50]来讨论离散性的影响,特别是当连续随机变量随后通过四舍五入到离散化尺度的整数倍进行离散时(相关问题也请参见第7节)。强相关时间序列的记录统计数据72.2。记录的年龄及其数量的联合分布从记录的数量开始,其他重要的可观测数据是记录的年龄,这是我们现在关注的。为了实现N个随机变量XI和M个记录的序列,我们用`=(`,`,…,`M)表示连续记录之间的时间间隔,如图1所示。因此` kis是第k条记录的年龄,也就是说,它表示第k条记录存在的时间(在数学文献中,这些年龄被称为“记录间时间”[41,51])。请注意,最后一条记录,即此序列中的第M条记录,仍然是“时间”N处的记录。其年龄被定义为其寿命N-Nm移动一个单位,其中Nm是最后一条记录的发生时间(见图1)。

12
nandehutu2022 在职认证  发表于 2022-5-31 03:15:43
这一定义简化了随后的计算。我们首先计算年龄的联合概率分布P(~`,M | N)和记录数M,给定序列的长度N。该分布可根据Xiin(1)asP(~ `,M | N)=Z的联合分布计算∞-∞dyMp(yM)酵素-∞p(x)dx`M-1×M-1Yk=1Zyk+1-∞dykp(yk)Zyk公司-∞p(x)dx`k-1δMXk=1\'k,N!,(14) 其中,如果i=j,则Kronecker deltaδ(i,j)=1,否则为0,确保样本的大小为N。如果执行变量uk=Ryk的变化-∞p(x)dx,(14)中的分布p(~`,M | N)可以写成asP(~`,M | N)=ZduMu ` M-1毫米-1Yk=1Zuk+1duku\'k-1kδMXk=1\'k,N!。(15) 可以直接执行(15)中的多重积分,得到p(~`,M | N)=`(`+`)。(`+`+··+` M)δMXk=1\'k,N!。(16) 必须强调的是,这种联合分布是完全通用的,即独立于父分布p(x)。这意味着,任何仅取决于记录年龄的可观测值都是完全通用的。非常有趣的是,虽然变量是独立的,但我们在(16)上看到年龄的Karecorrated,这在这个i.i.d.案例中产生了一个非平凡的年龄统计数据。在下一节中,我们将讨论第k条记录年龄的边际分布以及最长或最短记录的统计数据,并请读者参阅参考文献【52】——第1章——了解数学文献中关于i.i.d.随机变量记录年龄的更多详情和参考。我们通过对记录时间的备注来结束本节,记录时间是记录发生的时间,Nk=1+k-1Xj=1\'j,(2≤ k≤ M) ,(17){eq:Nk},N=1。有关这些记录时间的研究内容,请参见[36]。

13
mingdashike22 在职认证  发表于 2022-5-31 03:15:46
特别是,在大时间的连续极限中,这些记录时间(现在是由tk表示的强相关时间序列8的实变量记录统计信息)是递归生成的。连续的ratiostk-1tk=Uk,(18){等式:比率}是(0,1)上均匀的i.i.d.随机变量。这一性质有助于推导最长持续记录持续时间的渐近分布【36】【见下文第2.4节(29-30)】。2.3。第k条记录年龄的边际概率分布kc的边际概率分布可通过将(16)中所有年龄的完整联合分布P(~`,M | N)求和,j 6=k,然后将记录数求和得到:P(`k | N)=XM≥1台`≥1.X`k-1.≥1个\'k+1≥1.X\'M≥1P(~`,M | N)。(19) (16)中给出的全分布P(~ `,M | N)在年龄` jand的置换下显然不是不变的,因此P(` k | N)明确依赖于k。可以使用全联合分布(15)的积分表示法精确计算其关于N的母函数,结果为[53]XN≥1P(`k | N)zN=1- ZZDX(1- x)[-ln(1- x) ]k-1(k- 1) 哦!x`k-1.(20)我们看到(20)的右侧表现为∝ (1)- z)-1当z→ 1,由此我们得出结论,P(`k | N)趋向于一个平稳分布,作为N→ ∞, 其中,[51,54]P(\'k)=limN→∞P(`k | N)=Zdx(1- x)[-ln(1- x) ]k-1(k- 1) 哦!x`k-1(21)=` k-1Xm=0(-1) m级`k- 1米(2+m)k,其中第二行通过执行变量u=-ln(1-x) 在(21)中的积分中,使用二项式公式展开x\'k-1=(1-e-u) \'k-为了对u进行积分,概率P(`k)是一个单调递减函数,从P(`k=1)=开始-k

14
mingdashike22 在职认证  发表于 2022-5-31 03:15:50
对于大k,其渐近行为更容易从积分表示(21)中获得,积分表示可以通过变量v=(1)的变化在大k极限中进行分析-x) `kwhich yieldsP(`k)~(k)- 1) 哦![ln\'k]k-1\'k,\'k→ ∞ . (22)这表明当N→ ∞. 事实上,一个人可以从(20)thath\'ki那里看出~kk!,N→ ∞ . (23)有趣的是,通过使用斯特林公式k!≈√2πk ek ln k-k、 我们可以看到,作为k的函数,平均h\'ki允许kmax有一个最大值~ ln N,强相关时间序列9h\'kmaxi的记录统计量~ N(可能的对数修正)。因此,kmaxcoincides的典型记录数为hM i~ N,见(7)。这表明最长的lastingrecord很可能是最后一条记录,这很有可能发生≈ 0.62433[见下文(28)和(34)],或接近它[53]。下一节将讨论最长持续记录的统计特性。2.4。最长记录的年龄分布我们在前一节中已经看到,第k条记录的平均年龄h\'ki很大程度上取决于k,参见(23)。它的行为通常为(ln N)k/k!作为k的函数,kmax达到最大值~ O(ln N),其中为O(N)阶。在本节中,我们对这种极端行为进行了描述,并将重点放在以“max,N”表示的longestrecord的年龄上,该年龄定义为“max,N=max{`,`,…,M}”。(24)其累积分布F(`N)=Prob(`max,N≤ `), 对于`≥ 1,由(16)中的全联合分布求和M和``M带有约束`≤ `, . . . , `M≤ `. 它是N≥ 1,F(`N)=XM≥1`X`=1···`X`M=1δPMk=1\'k,N`(`+`)。(`+`+··+` M),(25),而F(` | N=0)=1。

15
能者818 在职认证  发表于 2022-5-31 03:15:54
利用(15)中分布的积分表示,可以方便地写出F(` | N)相对于N的母函数。经过一些操作后,可以写成[48]XN≥0zNF(` | N)=exp `Xk=1zkk!。(26)从` max的全分布的母函数,N(26)可以得到平均值h ` max的母函数,Ni=P`≥1(1- F(`N))asXN≥最大0h,NizN=1- zX公司`≥1.1.- 经验值-Xk公司≥`+1zkk. (27)通过在极限z内分析该表达式(27)→ 1,其中离散和可以用积分代替(设置z=e-s) 得到了h′max,Niash′max,Ni=λN+O(1),λ=Z的大N行为∞ds e公司-s-E(s)=0.62433,(28)式中,E(s)=R∞sdy e公司-y/y。在(28)中,λ被称为Golomb-Dickman或Goncharovconstant【55】。该常数λ还描述了随机置换的最长循环的线性增长[55]。它也出现在不断增长的网络模型中【36】和一维弹道聚合模型中【56】。参考文献【57】中建立了超越前导阶的h ` max,Ni的完全渐近展开式。可以找到“max,nca”统计的补充方法,例如,inrefs[36,58]。特别是,在长时间范围内,标度随机变量r=` max,N/N具有由fR,Prob(` max,N=`)表示的极限密度-→N→∞NfR公司`N. (29)记录强相关时间序列的统计数据100 0.2 0.40.60.8 1r00.511.52fR(r)n=80n=160xfR(x)图2。标度随机变量R的极限分布=`最大,N/N,见(29)。它是从最大生成函数的解析表达式(26)中获得的,对于N=80(绿色全圆)和N=160(蓝色空圆)。数据的良好折叠证实了(29)中的缩放形式。为了计算该极限分布fR(x),可以方便地研究具有极限密度fV(x)的倒变量V=1/R。

16
何人来此 在职认证  发表于 2022-5-31 03:15:57
结果表明,反变量V=1/R的拉普拉斯变换有一个显式表达式BFV(s)=he-sVi=Z∞dx fV(x)e-sx=1- e-E(s),(30){eq:fVhat},其中我们记得E(s)=R∞sdy e公司-y/y。注意,从(30)可以直接计算出平均hRi为λ=hRi=五、=Z∞dsbfV(s),(31),经过简单的部分积分后,返回Golomb Dickman constantin(28),即hRi=λ。此外,从(30),使用fR(x)=x-2fV(1/x),可以证明函数fR(x)是区间[0,1]上的分段连续函数,在形式[1,1/2],[1/2,1/3],…,的每个区间上连续。,在点xk=1/k,k=2,3,…,处显示奇点。。它有一个最大值x=x=1/2,其渐近超前行为由[36]fR(x)给出~经验值xln x, x个→ 0、1、x→ 1.(32)我们请读者参考参考文献[36],以了解有关此限制分布的更多详细信息。图2depicts fR(x)从强相关时间序列11\'max的记录统计的生成函数的解析表达式中获得,N=80(绿色全圆圈)和N=160(蓝色空圆圈),Ngiven by(26)。数据的良好折叠证实了缩放形式(29)。另一个相关的关注量是最长的lastingrecord是最后一条记录的概率,或打破年龄序列记录的概率,命名为qn=Prob(`M>max(`,…,`M-1) )=概率(`最大,N=` M)。(33){eq:QN}该序列在很大程度上收敛于Golomb-Dickman常数λ[36],limN→∞QN=λ,(34){eq:Qinfty},这意味着,对于很长的序列,持续时间最长的记录的分数等于λ。2.5。最短记录的年龄分布我们现在关注最短记录的年龄,用“min,N”表示,定义为“min,N=min{,`,…,`M}。(35)我们定义G(`N)=Prob(`min,N≥ `), ` ≥ 1,G(` | N=0)=0。

17
nandehutu2022 在职认证  发表于 2022-5-31 03:16:00
使用与上述“max,nw”相同的推理,我们可以找到G(`N)=Prob(`min,N)的母函数≥ `) 关于N asXN≥0G(`N)锌=膨胀Xk公司≥`zkk公司- 1.(36)平均值h` min的母函数,Ni=P`≥1G(` | N)可以从(36)中得到,这将产生大N[59]h` min,Ni=e的渐近结果-γEln N+o(ln N),(37),数值为e-γE=0.56145。,式中γE=0.57721。是Eulerconstant。另一方面,当N→ ∞, 我们可以很容易地证明G(` | N)收敛到一个平稳的累积分布函数,从中可以得到极限分布prob(`min,N=`)-→N→∞fmin(`)=exp“-`-1Xk=1k#1.- e-1个/`, ` ≥ 2,(38)而fmin(`=1)=1- e-1、极限分布fmin(`)是`的单调递减函数,其渐近行为由fmin(`)给出≈1.- e-1,`→ 1,e-γE`,`→ ∞ ,(39)记住,对于大\',fmin(`),这个渐近行为≈ e-γE/`,对于`≤ N、 这就产生了(37)中给出的h ` min,Ni的大N估计值。在图3中,我们展示了极限分布fmin(`)的曲线图,其中我们特别看到了渐近大`行为~ e-γE/`(39)给出了`&10的精确分布fmin(`)的非常准确的描述。记录强相关时间序列的统计数据1210-510-410-310-210-1100100101102 `fmin(`)图3。(38)中给出的极限分布fmin(`)的曲线图(蓝色圆圈)。红色虚线对应于(39)中给出的大的渐近行为。3、相关序列的记录统计:随机游走模型我们在上一节中看到,对于长度为N的不相关时间序列{X,X,…,XN},记录数M的统计以及记录年龄的统计可以通过分析计算得出。然而,在许多现实主义时间序列中,条目是相互关联的。

18
可人4 在职认证  发表于 2022-5-31 03:16:03
因此,问题自然而然地出现了:对于相关序列的记录统计,我们能说些什么?我们在下面回顾了随机游走序列的最新结果。我们从一条直线上的离散时间随机游动的简单情况开始。这将包括短程随机游动和长程L’evy游动,如下所述。此外,它可能包括存在恒定漂移的随机游动。步行者从原点X=0开始,其位置通过马尔可夫规则Xi=Xi在离散时间内演变-1+ηi(40){evolrw.1},其中ηire表示步骤i的随机跳跃长度。这些噪声变量ηiarei。i、 d.随机变量,每个随机变量取自跳跃分布φ(η)。跳线分布可以是对称的(无漂移)或不对称的(例如,在存在恒定漂移的情况下)。对称跳跃分布的几个例子是:(i)φ(η)=e-|η|(指数),(ii)φ(η)=σ√2πe-η/2σ(高斯),(iii)φ(η)=[Θ(η+1)-Θ(η- 1) ](统一[-1,1),(iv)φ(η)~ |η|-1.-u表示大η,0≤ u<2(L'evy flights),(v)φ(η)=[δ(η- 1) +δ(η+1)](晶格随机游动)。强相关时间序列的记录统计13在前四个示例中,跳跃分布是连续的。在最后一个例子中,跳跃分布是不连续的,步行者被限制在具有单位晶格间距的一维晶格上移动。对于前三个示例,步长的方差σ=R∞-∞ηφ(η)dη是有限的,而在列维情况下,σ是有限的。注意,即使噪声变量ηi不相关,位置Xiare也有很强的相关性。我们考虑这样一个由N个条目{X,X,…,XN}和M个记录组成的序列。有关说明,请参见图4。我们的第一个目标是计算记录数M的分布P(M | N)。我们还将对记录年龄的统计感兴趣。

19
能者818 在职认证  发表于 2022-5-31 03:16:06
随机变量“k”表示第k条记录的年龄,即第k条记录和(k+1)条记录之间的时间长度(见图4)。因此,除最后一个年龄外,年龄的定义与i.i.d.情况相同(见图1)。在这两种情况下,一组M=N-项目经理-1k=1\'k。然而,在这两种情况下,时间的起源是不同的,即对于i.i.d.变量,第一个记录开始于时间1,而对于随机游走,它开始于时间0。因此,在两个年龄段的M之间有一个单位的偏移。在图1中,一个单位为`=4,而在图4中,一个单位为`=3。因此,我们主要观察到的是记录的数量M,以及记录的年龄{`,`,…,`M}。根据上一节中调查的i.i.d.案例(见(3)和下文),我们仍然可以写入M=PNk=1σk,其中σkis是一个二进制变量:如果在步骤k出现记录,σk=1,否则σk=0。然而,与i.i.d.情况不同,变量σkare现在与随机游走情况相关。因此,很难直接计算P(M | N)的分布。那么,在这种情况下,如何计算P(M | N)?下面我们将看到,通过使用随机游动的更新性质,可以在计算P(M | N)方面取得进展。实际上,参考文献[46]中使用了这种方法来精确计算对称跳跃分布的P(M | N)。但是更新属性更一般,甚至可以用于具有漂移的随机游走序列[60,61],如下所示。有关续订流程的介绍,请参见,例如,[62、63、64]。3.1。参考文献[46]中的一般更新性质,我们注意到,与其试图直接计算P(M | N),不如首先考虑给定序列中更大的随机变量集合,即记录数M以及由向量`={,`,`,`,`M}表示的其年龄集合。

20
可人4 在职认证  发表于 2022-5-31 03:16:09
这些随机变量的联合分布将用P(~`,M | N)表示,如i.i.d.情况一样。主要的一点是,由于更新性质(如下所述),这种明显更复杂的联合分布实际上有一个相当简单的结构。因此,通过对联合分布中的年龄变量``进行积分,可以仅精确地获得记录数的边际分布p(M | N)。我们现在的目标是首先计算一般随机行走序列的联合分布P(~ `,M | N)。为此,我们需要两个关键数量作为构建块第一个数量是所谓的持久性或生存概率q(`)。从初始位置X开始的随机游动可能会保持在步骤\'q(`)=Prob以下X<X,X<X,X<X,X `<X十、= Prob公司X<0,X<0,X<0,X `<0X=0, (41)记录强相关时间序列的统计信息14timeiXiN\'1=4\'2=5\'3=3\'4=3图4。随机游走序列{X=0,X,X,…,XN}的典型实现,N=15步,M=4条记录。每条记录由一个填充的圆圈表示。集合{`,`,`}表示连续记录之间的时间间隔,`M=`是最后一条记录的年龄,该记录在时间N时仍为记录。定义为q(0)=1。从(41)中的第一行到第二行,我们使用了过程相对于起始点的平移不变性。显然,q(`)不依赖于X,我们可以将X设置为0。为了以后的目的,让我们也定义它的生成函数q(z)=X`≥0q(`)z`。(42){ql\\u gf}o第二个因素是相关的首次通过概率f(`)(起始于x=0)和定义的asf(`)=概率X<0,X<0,X个`-1<0,X`>0X=0. (43){fl\\u def}很明显,f(`)与q(`)viaf(`)=q(`-(1)- q(`)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 22:43