楼主: 大多数88
1155 40

[量化金融] 混合命中次数的可能性 [推广有奖]

21
可人4 在职认证  发表于 2022-6-23 21:20:58
此外,可能性和相应的估计量可以很容易地适用于其他实际相关的抽样方案,例如涉及区间截尾的抽样方案。3.2高斯特例假设{Y}是一个带漂移的布朗运动,因此,根据第2.3节的分析,T | X具有混合的逆高斯分布。然后,在一个包含截尾时间事件的常数内,Log条件(基于协变量)可能性lN(θ)等于lN(θ)=NXn=1lnZfBM(T*n | Xn,v;u,σ,β)DnFBM(T*n | Xn,v;u, σ, β)1-DndG(v;κ),(6),其中fbm(t | x,v;u,σ,β)=φ(x;β)vσ√2πtexp-[φ(x;β)v- ut]2σt(7) 是逆高斯分布的勒贝格密度,fbm(t | x,v;u,σ,β)=Φφ(x;β)v- utσ√t型-经验值2uφ(x;β)vσΦ-φ(x;β)v+utσ√t型(8) 是其生存函数(Cox a and Miller,1965年,第5.4节)。这里,Φ是累积标准正态分布函数。根据第2.5节G的有限离散规范,(6)中的对数可能性降低至lN(θ)=NXn=1lnLXl=1πlfBM(T*n | Xn,vl;u,σ,β)DnFBM(T*n | Xn,vl;u, σ, β)1-Dn。(9) 例如,如果我们指定φ(x;β)=exp(x′β),则使用(7)和(8)可以很容易地计算该对数似然、其导数及其最大化子^θ。在标准正则条件下,包括Corollary1参数识别所需的规范化和假设,^θ是θ的一致和渐近正态估计量。假设X的血缘分布和截尾时间不包含θ的信息,这也是有症状的。它是一个交感协方差矩阵,可以使用Fisher信息矩阵的得分或Hessian特征快速估计。统计文献中研究的许多模型同样导致了便于估计的可能性的明确表达式(Lee和Whitmore,2006)。

22
能者818 在职认证  发表于 2022-6-23 21:21:01
在一般的L'evy情况下,此类显式表达式不可用,并且无法直接实现最大可能性。下一节将介绍在这种一般情况下计算最大似然估计及其渐近分布的方法。3.3一般酪蛋白一般,f(·| x;θ)和f(·| x;θ)不是明确已知的,但可以通过数值反转其拉普拉斯变换来计算。我们的方法基于Rogers(2000)的工作,Rogers(2000)将Abate和Whitt(1992)反演方法的一种变体应用于计算光谱单侧DL'evy过程的首次通过时间分布的问题。继Rogers之后,我们首先考虑计算生存函数F(·| x;θ)。利用分部积分,很容易证明其拉普拉斯变换F(s | x;θ)≡R∞经验值(-st)F(t | x;θ)dt=s-1{1 - F(s | X)}。所以,对于givenθ,我们可以显式地构造f(s | x;θ)=s-1{1 - G[λ(s;u,σ,α)φ(x;β);κ]}a并使用梅林的逆公式(例如Davies,2002)获得F(·x;θ),F(t | x;θ)=2πilimξ→∞Zγξexp(st)F(s | x;θ)ds。(10) 这里,积分沿γξ:u等高线∈ [-1, 1] 7→ c+iξu,在c上画出一条直线,并从c到imag Inar轴f- iξ至c+iξ。我们将此轮廓与c∈ R通过写入γξ(u;c)表示其在u处的值来显式表示。应选择参数c,使其大于拉普拉斯变换F(·| x;θ)中任何奇点的真实部分。因为F(·| x;θ)在所有s的集合上是解析的Rs>0,我们可以选择任何c>0。(10)中的积分通常没有显式解,但可以使用数值方法有效近似。一个关键的复杂性是,我们的规范ofF(·| x;θ)涉及反函数∧,通常不能用封闭形式表示。

23
能者818 在职认证  发表于 2022-6-23 21:21:04
为了避免这个问题,我们遵循罗杰斯的方法,而是沿着|γξ积分≡ ψ o∧BMoγξ,是从ψ∧BM(C)到C的一个等高线- iξ;u, σ) ; u,σ,α]至ψ[λBM(c+iξ;u,σ);u,σ,α]。这里,∧bmi是ψ的布朗运动分量的拉普拉斯指数的倒数,其中(4)g给出了一个显式表达式。注意∧bm必然具有与ψ相同的色散参数σ,但其漂移参数不是唯一固定的(因为漂移参数o fψ取决于我们处理小激波的方式;见第2.2节)。幸运的是,漂移参数∧bm的精确值在下面的论证中不起作用。通常可以将其设置为所用ψ的特定参数化中的漂移参数;例如,μin(1)或μin(2)。根据第2.5节关于带复合泊松跳的ψ的规定,我们将∧bm的漂移参数设置为uin(2)。我们通过在u处写入|γξ(u;u,σ,α,c)来明确变换轮廓对c的依赖关系和ψ的参数。罗杰斯认为,在假设1下,在(10)中用|γξ替换γξ不会影响积分的值,因此f(t|x;θ)=2πilimξ→∞Z|γξexp(st)F(s;x;θ)ds=2πilimξ→∞Zγξq*(t,s | x;θ)ds,(11)带q*(t,s | x;θ)≡exp{ψ[λBM(s;u,σ)]t;u,σ,α}1- G[λBM(s;u,σ)φ(x;β);κ]ψ[λBM(s;u,σ)]ddsψ[λBM(s;u,σ);u,σ,α];不再涉及∧。这个论点依赖于柯西积分定理,该定理认为(10)中沿闭合轮廓的解析被积函数上的积分等于零。这对于由γξ向上移动γξ形成的闭合轮廓尤其如此(-1.c) 到γξ(1;c),从γξ(1;c)到|γξ(1;u,σ,α,c),从|γξ(1;u,σ,α,c)到|γξ(-1.u,σ,α,c),并从|γξ开始交叉(-1.u,σ,α,c)至γξ(-1.c) 。

24
kedemingshi 在职认证  发表于 2022-6-23 21:21:08
因此,(10)和(11)中的积分是相等的,前提是从γξ(1;c)到γξ(1;u,σ,α,c)的轮廓上的积分和从γξ到γξ的轮廓上的积分(-1.c) 至|γξ(-1.u,σ,α,c)消失为ξ→ ∞.罗杰斯得出结论,这是因为被积函数沿这两个常数ξ快速消失→ ∞ (特别是sF(s | x;θ)→ 1 as | s |→ ∞) 并且,在假设1下,它们的长度不会随ξ增长太快。特别地,γξ(1;c)- γξ(1;u,σ,α,c)γξ(1;c)=c+iξ- ψ[λBM(c+iξ;u,σ);u,σ,α]c+iξ=ψBM[λBM(c+iξ;u,σ);u,σ]- ψ[λBM(c+iξ;u,σ);u,σ,α]ψBM[λBM(c+iξ;u,σ);u,σ]收敛到零,为ξ→ ∞ (注意,(1)的右侧由大s的高斯项表示)。同样地,γξ(-1.c)-~γξ(-1.u,σ,α,c)γξ(-1.c)→ 0为ξ→ ∞.使用变量的变化,我们可以将(11)重写为实线上的积分:F(t | x;θ)=2πZ∞-∞q(t,u | x;θ,c)du,(12)其中q(t,u | x;θ,c)≡ q*(t,c+iu | x;θ)。在阿巴特和惠特之后,我们可以将三角法则应用于有限和的近似值(12)∞(t | x;θ,c,h)≡h2π∞Xr公司=-∞Rq(t,rh | x;θ,c),(13),其中h>0是规则的步长。注意,我们只需要近似(12)的实部,因为它的虚部应该是零。阿巴特和惠特讨论了这种离散化引入的误差,并指出它特别有效,因为积分振荡和近似误差最终会抵消。实际上,我们需要计算固定金额∞(t | x;θ,c,h)in(13)至SR(t | x;θ,c,h)≡h2πPRr=-RR对于某些R,q(t,rh | x;θ,c)∈ N并使用外推法逼近R→ ∞.

25
nandehutu2022 在职认证  发表于 2022-6-23 21:21:11
因为R(t | x;θ,c,h)在R,limR中几乎是周期的→∞SR(t | x;θ,c,h)可以使用Euler求和有效地近似:F(t | x)≈ ER,M(t | x;θ,c,h)≡MXm=0-M毫米SR+m(t | x;θ,c,h),(14)对于某些m∈ N、 Abate和Whitt建议通过ER,M+1(t | x;θ,c,h)估计相关误差-ER,M(t | x;θ,c,h)。在我们的例子中,随着M的增加,该估计值很快趋于零,这表明近似值是准确的(另请参见第4节)。我们遵循一个类似的过程,从拉普拉斯变换f(·| x;θ)计算密度f(·| x;θ)。我们再次从轮廓为γξ的梅林逆公式(10)开始,但现在f(t | x;θ)在其左侧,f(s | x;θ)在其右侧。随着G的离散化,F(s | x;θ)的消失速度比F(s | x;θ)(sF(s | x;θ)更快→ 0,而sF(s | x;θ)→ 1) as | s |→ ∞.这表明我们可以再次将梅林逆公式中的矩γξ替换为|γξ和thatf(t | x;θ)=2πilimξ→∞Zγξq*(t,s | x;θ)ds,其中q*(t,s | x;θ)≡exp{ψ[λBM(s;u,σ)]t;u,σ,α}G[λBM(s;u,σ)φ(x;β);κ]ddsψ[λBM(s;u,σ);u,σ,α]。这是因为F(s | x;θ)对于大s的行为受πexp项支配{-∧(s;u,σ)φ(x;β)v}对应于最低支撑点vof G。当G的规格接近零支撑时,F(s | x;θ)的消失速度可能比F(s | x;θ)的消失速度慢,如| s |→ ∞. 例如,如果G是伽马分布,可以表示| sF(s | x;θ)|→ ∞ as | s |→ ∞. 模拟表明,在这种情况下,我们的程序仍然是准确的。如前所述,我们可以将其重写为实线上的积分,f(t | x;θ)=2πZ∞-∞q(t,u | x;θ,c)du,其中q(t,u | x;θ,c)≡ q*(t,c+iu | x;θ),并用Euler-sumER,M(t | x;θ,c,h)近似此积分。可以使用不同的调谐参数c、h、R和M来控制f(t | x;θ)和f(t | x;θ)的计算。

26
何人来此 在职认证  发表于 2022-6-23 21:21:14
然而,正如我们对应的Euler和的符号ER,M(t | x;θ,c,h)andER,M(t | x;θ,c,h)所示,我们在本文中不会这样做。在设置c、h、R和M的共同值时,我们从罗杰斯那里得到了指导。在接下来的章节中,我们发现,他建议使用durat-ion-t特定值c=11/t和h=π/t,在我们的情况下会产生良好的数值性能。我们将采用这些作为默认设置,同时采用R=9和M=25。独立截尾样本满意度的对数似然性lN(θ)=NXn=1Dnln f(T*n | Xn;θ) + (1 - Dn)lnF(T*n | Xn;θ)≈NXn=1Dnln ER,M(T*n | Xn;θ、 c,h)+(1-Dn)lnER,M(T*n | Xn;θ、 c,h)。(15) 我们在MATLAB中实现了一个估计器,该估计器使用准牛顿算法最大化这种近似对数似然,并对Hessian和multiplerandom起始值进行BFGS更新(Nocedal和Wright,2006)。我们提供了关于参数向量θ的近似对数似然的n个分析梯度,以确保快速稳定的最大化。这个梯度将N个观测值的贡献相加。考虑观测值n的贡献。假设该观测值是完整的(Dn=1;截尾观测值的计算类似)。这个观测值的近似似然贡献,ER,M(T*n | Xn;θ、 Rogers(2000)声称R=6和M=15可以很好地权衡精确度和速度。由于此后计算速度的提高,我们可以选择更高的精确度。有关详细信息,请参见第4节。是q(T)的加权和的实部*n、 rh | Xn;θ、 c)r的值超过一个整数,权重不取决于θ。每个t项q(t*n、 rh | Xn;θ、 c)在该加权和中,是三个因素的乘积;exp[ψ(z;u,σ,α)T*n] ,G[zφ(Xn;β);κ]和ψ′(z;u,σ,α)∧′BM(c+irh;u,σ);在θ和z上平滑,由z=∧BM(c+irh;u,σ)组成,其本身在u和σ上平滑。

27
kedemingshi 在职认证  发表于 2022-6-23 21:21:18
它关于θ的复值导数源自乘积和链规则的繁琐但直接的应用。我们忽略了r上这些导数加权和的虚部,因为似然贡献f(t)的虚部*n | Xn;θ) 我们用ER,M(T)近似*n | Xn;θ、 c,h)为零。因此,我们将观测值n对对数似然方程梯度的贡献设置为导数加权和的实际par t除以ER,M(t*n | Xn;θ、 c,h)。分析梯度将这些贡献相加。我们从相应的Hessian构造渐近标准误差,我们使用分析梯度的有限差来计算。复制包(Abbring和Salimans,202 1)提供了进一步的详细信息。MATLAB代码目前通过设置u=1来规范化ψ(·|u,σ,α)。不是说这隐含地假设u>0。直接调整代码以代替规范化|u|=1,这通常允许u6=0,或σ=1,这根本不限制u。我们的估计器最大化了近似对数似然。对于某些应用,已经证明,如果近似值随样本量快速提高,则最大近似似然估计值与精确最大似然估计值一阶等价(例如,Ait-Sahalia,2002)。我们可以尝试使用Bate和Whitt的数值分析以及关于q(t,u | x;θ,c)和q(t,u | x;θ,c)尾部行为的一些进一步结果,为我们的估计量得出类似的等价结果。然而,正如我们将在第4节中看到的,我们可以在合理的时间内非常准确地计算估计量,因此,确定准确度应如何随样本量增加的正式结果将没有太多实际用途。

28
能者818 在职认证  发表于 2022-6-23 21:21:21
因此,我们采用了许多文献所采用的实用方法,并简单地应用标准d最大似然渐近。4数值实验我们通过进行一系列数值实验,研究了所提出的似然近似的准确性。我们讨论了其中三个实验的结果。除非另有明确说明,否则所有三个实验都使用控制近似的参数的默认设置。前两个实验直接比较了MHT模型所暗示的明确已知持续时间密度和可能性,而不影响其近似值。第三个实验集中在一个有冲击的模型上,对于这个模型,隐含的持续时间密度在显式形式下是未知的。第一个实验将使用(7)中密度的显式表达式对混合逆高斯模型的对数似然函数的直接计算与其随M变化的数值近似值进行比较。在第5节中使用的数据集上计算对数似然函数。这确保了这个实验既提供了一个真实的生命测试用例,也检查了我们在该部分中给出的结果。数据包含566个完整的罢工持续时间。由于近似误差接近无偏,因此对数似然误差随样本量的根进行缩放。图1绘制了对数似然绝对近似误差的平均值,对于不同的M值,在其最大似然估计的尺度上随机生成100多个模型参数。我们发现,该平均绝对误差随M呈指数递减;该结果在各种参数值上都是稳健的,在这些参数值上绘制的结果是平均的。与Rogers(2000)一致,我们发现M=15已经为大多数实际目的提供了一个合适的近似值。

29
可人4 在职认证  发表于 2022-6-23 21:21:25
然而,因为这就是Singleton(2001)处理离散采样函数的最大似然估计的方式,与我们的估计一样,这需要数值傅里叶反演。他对傅里叶反演程序的计算负担表示担忧,但仅限于多元情况。我们仅使用单变量四ie r反演,并从20年的计算发展中获益。图1:各种M5 10 15 20 25 30的对数似然近似误差-10-5注:该图基于对数可能性l具有布朗运动潜伏期过程和离散不可观测异质性的MHT模型的N(θ),具有Kennan(1985)completestrike持续时间数据的四个支撑点。它绘制了lN(θ)及其在100个随机抽取的参数值θ上的数值近似值,取值范围为M。误差以对数标度重新绘制。对于φ(X;β)V=1的简单逆高斯模型,通过将u和σ设置为其最大似然估计值,这对于m是闭合的,V=1。异质性分布的其余支撑点v、v和VO是通过标准正态分布的指数化绘图生成的,因此它们在水平上有所不同,但都近似于正确的曲线。我们所有的支撑点都有1/4的概率质量。参数β乘以卵巢数设置为零。计算所需的时间仅以M为单位呈线性增长,我们可以以非常低的计算成本将M增加到25,并获得近千倍的精度提高(大多数g都是在M=20时获得的)。一次M≥ 25,其他因素,如舍入误差,变得很重要,近似误差水平也会起作用。我们还发现,当M=25时,增大R或减小步长h对反演精度的影响很小。

30
能者818 在职认证  发表于 2022-6-23 21:21:28
Log似然的数值近似计算时间是解析表达式的9-11倍。然而,从绝对值来看,这仍然是很容易管理的。例如,用普通笔记本电脑上100,00 0次的冲击计算规格的密度大约需要一秒钟。我们始终在MacBook Pro(2 018,15英寸,2.9GHz6核Intel Core i9,32 GB 2400 MHz DDR4)和macOS 10.15.7上使用图3的规格和MATLAB 2020b。图2:对数逆高斯密度函数的近似误差-25-20-15-10-5 0-10-5ln-fBM(t | X)注:该图绘制了参数u=σ=φ(X;β)V=1的对数反高斯密度ln-fBM(t | X;θ)与其对数尺度上的数值近似值与ln-fBM(t | X;θ)之间的绝对差异,时间范围为t。这样,可以最大化对数可能性,从每次最大化的多个随机参数值开始,对于我们在第5节中考虑的模型规格,不到半分钟的时间。第二个实验更仔细地研究了基本逆高斯模型的密度fBMof的数值近似,该模型的参数为u=σ=φ(X;β)V=1。我们只给出了M=25的结果,但发现了与M非常相似的结果≥ 为了进行最大似然估计,我们最关心的是对数密度ln fBM的近似误差。图2以对数标度绘制了该近似值相对于对数密度本身的绝对误差。图中显示的(对数)线性相关表明,Ln fBM(t | X;θ)近似值的绝对误差大致等于10-11/fBM(t | X;θ)。因此,近似误差通常很小,但当密度变得非常小时(例如,fBM(t | X;θ)<10),近似就会崩溃-10或ln fBM(t | X;θ)<-23 ).

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 15:00