楼主: 大多数88
2159 55

[量化金融] 多协变量点过程预测的估计 [推广有奖]

31
能者818 在职认证  发表于 2022-5-31 04:37:55
澳元往往与新西兰元挂钩,但流动性更强。因此,它可能提供有关贸易抵达的有用信息。过去的持续时间被发现是一些高频金融应用的重要预测因素(例如,Engle和Russell,1998)。然而,书籍信息似乎有更大的影响。在下一节中,仅使用表1中变量的线性模型也将用于比较,并将被称为受限线性模型。4.3.1样本外绩效在第一天对模型进行了估计,有兴趣了解该模型是否可用于解释样本外的交易到达。这是通过计算平均对数似然比(g,g′)/S和σS来完成的/√第二天(见提案1)。然后可以使用命题1构建置信区间。目标是评估线性和立方模型以及受限模型(表1中有变量的模型)的样本外性能。验证将注意力限制在线性模型上是否会产生类似的样本外结果是很有意义的。当与恒定强度(续)进行比较时,该常数被计算为样本外最大似然估计量,即事后最佳常数强度。表2显示,所有模型都在具有压倒性证据的恒定强度上有所改善。当查看无限制模型的相对优点时,立方模型是否会在样本之外增加价值就变得不清楚了。从受限线性模型相对于非受限线性模型来看,有大量证据表明,非受限线性模型更可取。有趣的是,在比较受限模型时,有压倒性的证据表明立方模型确实比线性模型有所改进。

32
mingdashike22 在职认证  发表于 2022-5-31 04:37:59
从这些结果可以推断,在研究小尺寸模型时,建模非线性确实会产生效果。然而,当模型是线性的,但有许多协变量时,账面和交易变量的非线性影响不太明显。第5节的模拟结果支持这一说法。表2:模型的样本外性能:g与g′,其中g和g′在以下标题中定义。林vs.康斯特。立方vs.常数。买入卖出买入卖出。记录LR。×103.77 4.48 4.02 4.56S。E、 ×100.33 0.25 0.31 0.26P-Val。<0.01<0.01<0.01<0.01立方vs.LinearBuy SellAvg。记录LR。×100.25 0.08S。E、 ×100.08 0.07P-Val。<0.01 0.22Lin。限制。vs.Const。林氏硬度。vs.Lin.买入卖出买入卖出。记录LR。×101.14 1.24-2.63-3.25S。E、 ×100.15 0.14 0.20 0.19P-Val<0.01<0.01<0.01<0.01<0.01立方限制。vs.Lin.Rest。买入卖出。记录LR。×100.26 0.25S。E、 ×100.10 0.06P-Val。<0.01<0.015数值示例如第1.2节所述,{∧((Ti-1,Ti)):i∈ N} (如(1)中的∧)是i.i.d.指数分布,平均值为1。为简单起见,在模拟中,假设协变量仅在跳跃时间Ti’s处更新。因此,区间(Ti-1,Ti]是根据参数exp{g(X(Ti))的指数分布模拟的-1) )},即具有平均exp{-g(X(Ti-1) )}。协变量是标准高斯随机变量,Toeplitz协方差Cov(Xk(t),Xl(t))=ρ| k-l |且随时间不相关。变量的绝对值被限制为2,即它们取[-2,2]。模拟中的参数为K∈ {10,50}协变量数,T=T(recallN(Tn)=n)样本量,ρ∈ {0,0.75}。考虑了g和Θ的不同选择。总结如下。为了简化估计,Θ是一组有限的函数。5.1真未知模型g我们描述了真函数g的各种选项。

33
大多数88 在职认证  发表于 2022-5-31 04:38:02
真函数g的形式为g(x)=PKk=1g(k)(x),其中函数g(k)定义如下。真加法函数。线性:g(k)(x)=b0kxk;非线性:g(k)(x)=b0k(| xk |+0.5xk)。活动变量。当k=1时,b0k=1;当k>3时,b0k=0;ManySmallb0k=1/√10代表k≤ 10,当k>10时,b0k=0。即使没有模型错误,研究人员也不知道这些值。5.2 L(B,Θ,W)中的估计量这里我们定义了研究人员使用的参数空间L(B,Θ,W)。进行估算时考虑到模型的错误说明。因此,根据设计,功能的选择不需要对应于真正的功能g(k)(第5.1节)。估计模型的形式为g(x)=PKk=1Pθ∈920kbθ(x)。关于Θ和bθ估计的详细信息如下。Θ中的函数。线性(Lin):θ(x)=xkforθ∈ Θk;单项式(Poly):θ(x)=(xk/2)aforθ∈ Θk,a=1、2、3。默认情况下,会在估计中添加一个常量。当真函数为线性时(即,g(k)(x)=b0kxk),则不存在误判错误。然而,仍然需要对系数进行估计,其中许多系数可能为零。当真函数为非线性时,即使使用多项式(Poly)进行估计,也会产生误判错误。然而,在这种情况下,误判的程度很小。选择“B”和“W”参数“B”被选为“B”∈ {1、4、8、16}最大化第3.7节中定义的ICT。在这种情况下,样本量相对较小,AIC和交叉验证的性能(忽略许多变量)相似。因此,出于计算方便,最好使用AICTis。我们应用了第3.5节中的算法,F=ln(N(T)/T),而不是F=0。在这种情况下,EFI是Pλ的估计量,即预期强度。

34
nandehutu2022 在职认证  发表于 2022-5-31 04:38:06
主要原因是为了减少对不同功能和模拟设计的可能B值集的微调。模拟设计是这样的:随着活动变量数量的增加,Pλ增加,结果是B。如第4.2节所示,选择W中的权重作为样本Lnorm。注意,nowinsorization应用于变量,因为它们已经有界了。5.3模拟结果考虑以下损失函数来评估模型fit,损失(g):=\'t+ST[g(X(t))- g(X(t))]dN(t)'t+ST[g(X(t))- γ] dN(t)(16),其中γ:=\'t+STg(X(t))dN(t)N(t+S)-N(T)。该损失函数正好指出,当S较大时,损失(g) |g级- g |λ/hinfγ>0 | g- γ|λi。因此,损失中的分子是定理1收敛准则的近似值,而分母是γ产生的误差,这是事后发现的最佳常数近似值。标准化确保损耗(g)∈ [0,1)如果g超过γ,如果没有损失(g)≥ 损失分母是此处进行的有限样本实验的基准。在模拟中,为采样周期[0,T]生成数据,并在[0,T]上估计模型,在[T,T]上评估样本外性能。因此,在损耗中,T=Tand S=T-T、 表3报告了损失的主题(gT)(损失)以及75%和25%分位数。总的来说,真实模型(线性或凸)和基函数的不同选择允许我们衡量估计器的主要特征。表3中的结果总结如下。当真实模型为非线性时,使用非线性模型有明显的优势,但当真实模型为线性时,也会有相当大的损失(主要是由于估计误差)。对于多项式等非线性估计器,明智地选择W来消除高阶系数的影响可以使估计器更加稳健。

35
能者818 在职认证  发表于 2022-5-31 04:38:09
目前对W的选择相当于通过变量的Lnorm来标准化变量。这很简单,但如果多项式的阶数不像这里那么小,可能会导致较大的振荡。在处理多项式时,W的选择是建模和估计过程的一个重要部分。变量相关性的增加会产生更好的预测。这与可变筛选的问题形成了对比。作者的数值实验(此处未报告)以及文献中的相关结果(如Bradic et al.,2011)表明,在这种情况下,主动变量的错误发现随着相关性的增加而显著增加。这是很自然的,相关性混淆了每个变量的优点。预测和变量筛选是相关但互补的问题,需要单独处理。表3:后见之明与最佳恒定强度相关的模拟结果。估计基于对应于N(T)=100个跳跃次数的Sizet样本。该表报告了中位数(Med.)以及损失×100的25(Q25%)和75(Q75%)分位数(损失如(16)所示)。一个低于100的数字意味着后见之明的最佳恒定强度的相对改善。损耗×100损耗×100Med。Q25%Q75%Med。

36
kedemingshi 在职认证  发表于 2022-5-31 04:38:12
Q25%Q75%ρ=0ρ=0.75gis线性FEWLAGE K=10Lin 3.70 2.37 5.72 1.69 1.11 2.61多边形5.54 3.60 8.10 2.76 1.85 4.19gis线性FEWLAGE K=50Lin 6.83 4.92 9.41 3.64 2.34 5.26多边形10.61 8.01 13.66 4.30 2.82 6.65gis线性ManySmall K=10Lin 13.42 9.90 19.16 2.72 1.93 3.87多边形32.88 24.93 41.65 4.65 05 2.63 5.90gis线性ManySmall K=50Lin 47.02 35.29 57.26 4.81 3.42 6.22多边形60.83 51.45 74.576.23 4.64 8.30gis凸面FEWLAGE K=10Lin 81.08 75.13 92.10 70.08 63.90 77.56多边形19.92 15.03 26.82 9.35 7.19 12.77gis凸面FEWLAGE K=50Lin 110.23 90.67 123.28 83.53 72.46 95.66多边形35.47 28.08 45.36 14.70 11.86 19.36gis凸面ManySmall K=10Lin 97.95 87.20 112.47 73.59 66.67 82.64多边形17.16 14.42 20.58 5.49 4.906 GIS凸面ManySmall K=50Lin 104.12 94.80 114.59 67.38 62.5574.41Poly 48.24 40.72 57.95 10.67 8.86 13.135.3.1动力学模拟:具有协变量的霍克斯过程先前的模拟考虑了与时间无关的协变量。在这里,我们使协变量具有时间依赖性,遵循自回归过程,并允许强度遵循霍克斯过程。考虑强度λ(t)=exp(lnc+^(0,t)e-a(t-s) dN(s)!+g(X(t))(17)这是第3.6.2节的形式,虽然函数f(·)=ln(c+·)在下面有界(因为它的域是正的),但在上面没有界。这里,要求c>0以避免简并。为了直接应用第3.6.2节中的结果,我们可以使用f(·)=max{ln(c+·),\'c}来代替某些有限的\'c,在这种情况下,可以确保过程是稳定的(见推论5)。该过程简化为λ(t)=c+^(0,t)e-a(t-s) dN(s)!exp{g(X(t))}。(18) 使用标记霍克斯过程的结果(例如,Bremaud et al.,2002),可以推测,如果a>e exp{g(X(t))},则(18)将是平稳的。据作者所知,正式的现有结果并不完全符合(18)的框架。

37
mingdashike22 在职认证  发表于 2022-5-31 04:38:15
在模拟中,我们将constantto添加到真实模型中,即g(x)=γ+PKk=1g(k)(x),其中γ=-E expnPKk=1g(k)(X(t))o,因此E exp{g(X(t))}=1。当NA>1时,这应确保上述(18)的平稳性。除此之外,gare的真实模型如第5.1节所示。在模拟中,我们验证了(18)的r.h.s.上括号中的术语保持有界,因此确保了平稳性,无需封顶常数c。可以对该模型进行模拟和估计,有关这一点的详细信息以及下面讨论的一些计算可以在补充材料的a.2节中找到。与前面的模拟一样,我们让X(t)=X(Ti-1) 对于t∈ (Ti-1,Ti]。然而,X(Ti)现在遵循向量自回归X(Ti)=0.95X(Ti-1) +εi,X(T)=ε,其中K维新息εi生成为i.i.d.截断高斯分布,toeplitz协方差与第5.3节中使用的i.i.d.X(Ti)完全相同。如果在之前的模拟中X(Ti)是独立的,则霍克斯分量的依赖性将被exp{g(X(Ti))}中的独立可变性所混淆。给定依赖结构,我们使用更大的样本量tn,n=200。在模拟中,我们将c=2,a=1.3。除了这些差异外,设置与先前模拟中的设置相同。然而,我们需要估计cand aas额外参数。模拟的目的是看看在时间自变量的情况下所做的评论在这种情况下是如何保持的。结果见表4。表3和表4中的结果不具有直接可比性,因为平稳性需要标度。然而,我们可以从相对的角度得出结论。表4证实了表3的总体情况。然而,正如预期的那样,依赖性使问题变得更加困难。

38
能者818 在职认证  发表于 2022-5-31 04:38:19
在当前情景下,当真实的GIS非线性大幅下降时,估计非线性模型的相对益处。例如,在ConvexManySmall K=50的情况下,表3中Lin和Poly的损耗比为104.12/48.24=2.16,而表4中为52.55/42.55=1.23。表4:后见之明与最佳恒定强度相关的模拟结果。模型如(17)所示。估计基于与N(T)=200跳跃次数相关的大小T的样本。该表报告了中位数(Med.)以及25(Q25%)和75(Q75%)%的损失量×100(如(16)中的损失)。低于100的数字意味着事后来看,最佳恒定强度的相对改善。损耗×100损耗×100Med。Q25%Q75%Med。Q25%Q75%ρ=0ρ=0.75gis线性FEWLAGE K=10Lin 1.04 0.71 1.51 0.54 0.37 0.81多边形1.53 1.01 2.34 0.95 0.70 1.31gis线性FEWLAGE K=50Lin 3.53 1.78 7.78 2.72 1.96 3.74多边形4.76 2.87 8.29 4.15 3.26 5.60gis线性Manysmal K=10Lin 2.53 1.70 3.76 0.95 0.59 1.38多边形5.22 3.57 7.01 1.77 1.27 2.52gis线性ManySmall K=50Lin 19.70 13.32 28.09 4.66 3.13 6.96多边形20.49 14.23 28.27 6.224.28 8.88gis凸面FEWLAGE K=10Lin 45.96 37.24 57.86 36.94 29.25 48.42多边形5.82 4.38 8.16 3.26 2.40 4.70gis凸面FEWLAGE K=50Lin 72.03 56.68 91.19 44 36.51 55.90多边形26.40 20.22 36.27 14.58 11.59 20.43gis凸面ManySmall K=10Lin 33.96 26.78 46 21.46 17.07 28.86多边形14.35 10.79 19.01 5.43 3.93 7.84gis凸面ManySmall YSMALL K=50Lin 52.55 42.57 68.41 32.56 24.28 42.81多边形42.55 34.7950.73 23.48 17.94 29.866结论性意见本文介绍了高维点过程估计的一般框架,其中重点是预测。使用greedyalgorithm,估计方法是可行的。在许多添加剂组分的情况下,稠度率是最佳的。

39
nandehutu2022 在职认证  发表于 2022-5-31 04:38:22
作为主要结果的推论,导出了一组不同估计程序及其收敛性的适用性示例。这种渐近分析不同于只有少数变量处于活动状态的情况,这通常在高维文献中讨论。在金融领域,由于信噪比很低,通常会发现大多数变量是横截面相关的,但预测值很弱。因此,无人主宰。因此,这里进行的渐近分析就是这样。对新西兰元期货买卖交易到达量预测的实证研究表明,使用一小部分变量可能是次优的。因此,使用许多变量是值得的,只要它们正确聚合。在高维模型估计的情况下,需要设计更多的推理程序。在财务方面,许多应用程序需要对模型性能进行抽样评估。在高频情况下,数据集的大小很大,估计过程需要在计算上可行。本文提供了这方面的一些解决方案。对于非常大的样本量,可能需要放弃使用可能性,使用近似值。在这种情况下,可以将强度密度直接建模为加法模型,并用平方损失对比度估计器代替可能性(例如,Gaiffas和Guilloux,2012)。这方面的应用将是未来研究的主题。参考文献[1]Andersen,P.K.和R.D.Gill(1982)《计数过程的Cox回归模型:大样本研究》。《统计年鉴》101100-1120。[2] Barron,A.R.,A.Cohen,W.Dahmen和R。A.DeVore(2008)《贪婪算法的近似和学习》。《统计年鉴》36,64-94。[3] 鲍文斯,L.和N。

40
mingdashike22 在职认证  发表于 2022-5-31 04:38:26
Hautsch(2009)《使用PointProcess建模金融高频数据》。T.G.Andersen、R.A.Davis、J.-P.Kreiss和T.Mikosch(编辑),《金融时间序列手册》,953-982年。纽约:斯普林格。[4] Bühlmann,P.和S.van de Geer(2011年)《高维数据统计》。伦敦:斯普林格。[5] Bunea,F.、A.Tsybakov和M.Wegkamp(2007)《高斯回归的聚合F》。《统计年鉴》351674-1697。[6] Bradic,J.、J.Fan和J.Jiang(2011)具有NP维度的Cox比例危险模型的正则化。《统计年鉴》393092-3120。[7] Brémaud,P.(1981)《点过程和队列:鞅动力学》。纽约:斯普林格。[8] Brémaud,P.和L.Massoulié(1996)非线性Hawkes过程的稳定性。《可能性年鉴》第24期,1563-1588年。Bühlmann,P.和S.van de Geer(2011年)《高维数据统计》。伦敦:斯普林格。[9] Brémaud,P.、G.Nappo和G.L.Torrisi(2002)Marked Hawkes过程均衡收敛速度。应用概率杂志39123-136。[10] Burman,P.、E.Chow和D.Nolan(1994),《依赖数据的交叉验证方法》。Biometrika 81351-358。[11] Engle,R.F.和J.R.Russell(1998)《自回归条件持续时间:不规则间隔交易数据的新模型》。《计量经济学》661127-1162。[12] Fan,J.、I.Gijbels和M.King(1997)Hazard R回归中的局部似然和局部局部似然。《统计年鉴》251661-1690。[13] Gai ffias,S.和A.Guilloux(2012年),《高维附加危险模型》和《社会科学》。电子统计杂志6522–546。[14] Hall,D.和N.Hautsch(2007)对限价订单市场中的买卖强度进行建模。《金融市场杂志》第10期,第249-286页。[15] Hasbrouck,J.(1991)测量股票价格的信息含量。《金融杂志》46179-207。[16] Jaggi,M。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 20:42