楼主: 大多数88
1490 21

[量化金融] 高频金融中的半马尔可夫模型 [推广有奖]

11
可人4 在职认证  发表于 2022-5-5 07:10:54
在这里,基于对财务回报的应用,我们考虑一个更灵活的指数过程,定义如下:Uλn=n-1Xk=0Tn-K-1Xa=Tn-1.-kf(Jn)-1.-k、 a,λ,(20)式中f:E×IN×IR→ IR是一个Borel可测有界函数,Uλ已知且非随机。8 Guglielmo D’Amico、Filippo Petroni和Flavio PratticoThe过程Uλnca可以被解释为一个累积奖励过程,其函数f是单位时间内加权奖励率的度量。函数f取决于当前时间a和状态Jn-1.-kvisited在当前时间和代表重量的参数λ上。在下一节中,将选择f的特定函数形式,以生成realdata应用程序。为了构建WISMC模型,我们必须指定变量之间的依赖结构。为此,我们采用以下假设:P[Jn+1=j,Tn+1- Tn≤ t |σ(Jh,Th,Uλh),h=0。。。,n、 Jn=i,Uλn=v]=P[Jn+1=j,Tn+1- Tn≤ t |Jn=i,Uλn=v]:=Qλij(v;t),(21)式中σ(Jh,Th,Uλh),h≤ n是三变量过程的自然过滤。函数矩阵Qλ(v;t)=(Qλij(v;t))i,j∈EH在我们将要揭示的理论中起着基础性作用,鉴于其重要性,我们称之为加权指数半马尔可夫核。联合过程(Jn,Tn)取决于过程Uλn,后者作为一个随机指标。此外,指数过程Uλ通过函数关系(20)依赖于(Jn,Tn)。观察ifP[Jn+1=j,Tn+1- Tn≤ t | Jn=i,Uλn=v]=P[Jn+1=j,Tn+1- Tn≤ t | Jn=i]对于所有值v∈ 索引过程的IR,然后在普通半马尔可夫核中生成加权索引半马尔可夫核,WISMC模型与经典半马尔可夫链模型等价,如[14]和[2]中所示。三重过程{Jn,Tn,Uλn}仅在对应于过渡时间Tn的情况下描述系统的行为。

12
nandehutu2022 在职认证  发表于 2022-5-5 07:10:59
为了描述模型在过渡时间或等待时间内的行为,我们需要定义额外的随机过程。给定三维过程{Jn,Tn,Uλn}和加权指数半马尔可夫核Qλ(v;t),我们定义byN(t)=sup{n∈ N:Tn≤ t} );Z(t)=JN(t);Uλ(t)=N(t)-1+θXk=0(t∧TN(t)+θ-(k)-1Xa=TN(t)+θ-1.-kf(JN(t)+θ-1.-k、 a,λ,(22),其中θ=1{t>TN(t)}。(22)中定义的随机过程分别代表到时间t的过渡次数、到时间t的系统状态(价格回报)和到时间t的指数过程值(价格回报函数的加权移动平均值)。我们把Z(t)称为加权指数半马尔可夫过程。过程Uλ(t)是过程Uλn的推广,其中时间t可以是高频金融中的半马尔可夫模型:回顾时间或等待时间。很容易认识到,如果t=tn,则Uλ(t)=Uλn.Letpλij(v):=P[Jn+1=j | Jn=i,Uλn=v]是嵌入索引马尔可夫链的转移概率。它表示下一个转变处于状态j的概率,假设在当前时间过程进入状态i,指数过程等于v。很容易实现pλij(v)=limt→∞Qλij(v;t)。(23)设Hλi(v;·)为状态i中的逗留时间累积分布∈ E:Hλi(v;t):=P[Tn+1- Tn≤ t | Jn=i,Uλn=v]=Xj∈等式λij(v;t)。(24)它表示从停留时间小于或等于的状态i过渡到t的概率,给定索引过程为v。条件等待时间分布函数G表示以下概率:Gλij(v;t):=P[Tn+1- Tn≤ t | Jn=i,Jn+1=j,Uλn=v]。(25)很容易确定gλij(v;t)=Qλij(v;t)pλij(v)如果pλij(v)6=01如果pλij(v)=0。(26)3.

13
可人4 在职认证  发表于 2022-5-5 07:11:02
实证结果为了检验我们模型的有效性,我们比较了真实数据回报和基于模型的蒙特卡罗模拟产生的回报的行为。在本节中,我们描述了用于分析的真实数据数据库,以及用于模拟综合收益时间序列的方法,最后,我们比较了真实数据和模拟数据的结果。3.1. 数据库描述我们用来比较真实数据与SMC模型和ISMC模型结果的数据是从www上下载的指数和股票的逐点报价。borsaitaliana。2007年1月至2010年12月(四个完整年份)。数据已重新采样,频率为1分钟。考虑一天(比如第1天)≤ K≤ d) 其中d是时间序列中的交易天数。在我们的案例中,我们考虑四年的交易(从2007年1月1日开始,对应于d=1076)。意大利市场在上午9点后的第一分钟内随机确定开盘价,连续交易在下午5点25分之前立即开始,最后收盘价在下午5点30分之后确定。因此,让我们将S(t)定义为上午9.01.00之前最后一次交易的价格,S(t+1)定义为上午9.02.00之前最后一次交易的价格,依此类推,直到10 Guglielmo D’Amico、Filippo Petroni和Flavio Prattico 2 4 50510x 104个州过渡图2。嵌入马尔可夫链的转换次数。S(nk)为下午5:25.00前最后一次交易的价格。如果在这一分钟内没有交易,价格保持不变(即使在所有权被暂停并在同一天重新开放的情况下)。还确定S(nk+1)为开盘价,S(nk)为收盘价。用这个选项n=507。2009年9月28日之前有一个小的差异,因为连续交易在上午9点05分开始,因此在该日期之前我们有n=502。

14
能者818 在职认证  发表于 2022-5-5 07:11:05
最后,如果产权延迟开盘或提前关闭(暂停但未重新开盘),则只考虑有效交易记录。在这种情况下,n将小于507。然后,每个股票的分析收益数约为50.8万。我们分析了FTSEMIB的所有股票,这是意大利股市中资本化程度最高的40只股票。为了能够将收益建模为SMC,必须对状态空间进行离散化。在所示的例子中,我们将收益离散为5种状态,选择它们相对于等于零的收益对称。由于股票价格的离散化,回报率实际上已经在实际数据中离散化,而股票价格由每个证券交易所确定,并取决于股票的价值。举个例子,在意大利股票市场上,股票的价值在5之间。0001欧元和10欧元——最小变化固定为0.005欧元(通常称为滴答)。Wethen试图尽可能接近这种离散化。在图2中,我们展示了嵌入马尔科夫链从状态i过渡到所有其他状态的次数示例。对于WISMC模型,我们从意大利证券交易所(“Borsa Italiana”)和德国证券交易所(“Deutsche B¨orse”)的两个实时股票报价数据库中选择了4只股票。选择的股票是意大利数据库中的埃尼和菲亚特,以及德国数据库中的安联和大众。从2007年1月到2007年12月的时间段。数据已重新采样,频率为1分钟。然后分析的回报数量大约为500* 每只股票10英镑。在这4个例子中,我们将收益离散为5个状态,选择与高频金融中的半马尔可夫模型对称:回顾11"i!"i\" #$ "i\" "i%#$ % %#$ \" \" #$ !&’“"i(\')*+,)-.”/0-+1-,0,21.3)*+14*5图3。

15
何人来此 在职认证  发表于 2022-5-5 07:11:08
回报的离散化。关于收益等于零,并保持分布形状不变。同样在这种情况下,回报已经离散化。在图3中,我们展示了一个离散化分析股票收益的例子。根据离散化收益,我们估计了生成所描述模型的合成轨迹的概率P和Gij(t)。为此,我们推导了蒙特卡罗算法,以模拟给定模型在时间间隔[0,T]内的轨迹。选择的时间序列(如合成时间序列)与真实时间序列的长度相同。该算法的输出包括连续访问状态{J,J,…},跳跃时间{T,T,…}直到T。下面的算法是半马尔可夫模型的蒙特卡罗模拟示例:1)集合n=0,J=i,T=0,水平时间=T;2) 从pJn中取样J,·并设置Jn+1=J(ω);3) 从GJn、Jn+1(·)中取样W,并设置Tn+1=Tn+W(ω);4) 如果Tn+1≥ T停止设置n=n+1并转到2)。自相关函数的结果股市数据的一个非常重要的特征是,虽然收益率是不相关的,并且表现出类似i.i.d.的行为,但它们的平方或绝对值是长期相关的。非常重要的是,回报的理论模型确实再现了这一特征。然后,我们测试模型,以检查它是否能够重现这种行为。我们提醒一下自相关函数的定义:如果Z表示收益,收益平方的时间标记(τ)自相关定义为∑(τ)=Cov(Z(t+τ),Z(t))V ar(Z(t))(27)我们估计了真实数据和用不同模型模拟的收益时间序列的∑(τ)。使时滞τ从1分钟运行到100分钟。

16
大多数88 在职认证  发表于 2022-5-5 07:11:11
要注意的是,要想让古列尔莫·达米科、菲利波·彼得罗尼和弗拉维奥·普拉蒂科都能做到这一点!\" ! #! $! %! &! !! ’! (!! ’&! ’\"! ’)*+, - ./01.2, +3405*67688- /0*+63..9 - 0/.: 0*0; - , +< 08=6>; - , +< 08=6>., ?&!; - , +< 08=6>., ?) !; - , +< 08=6>., ?&(!图4.标签中描述的真实数据(实线)和4个合成时间序列的自相关函数。比较∑(τ)的结果每个模拟时间序列的生成长度与实际数据相同。图4显示了索引半马尔可夫模型(m值很少)、真实数据和无索引的asemi马尔可夫模型的结果。正如预期的那样,真实数据确实显示了波动性的长期相关性,让我们来分析合成时间序列的结果。简单的半马尔可夫模型从相同的值开始,但持续时间很短,经过几个时间步后,自相关系数降至零。一个非常有趣的行为由带有memoryindex的半马尔可夫模型显示。如果使用一个小内存(在所示示例中为m=10),则自相关已经持续,但其下降速度再次快于实际数据。在较长的内存(m=30)下,自相关在很长一段时间内保持较高,并且其值非常接近真实数据的值。如果m进一步增加,自相关性再次下降到较小的值。这种行为表明存在最佳记忆m。在我们看来,短记忆不足以确定市场的波动状态,太长的记忆混合了不同的状态,然后大部分信息在平均水平上丢失,这就证明了这种行为的合理性。所有这些都如图5所示,其中计算了模拟时间序列的每个自相关函数与作为m函数的真实数据的自相关函数之间的均方误差。

17
能者818 在职认证  发表于 2022-5-5 07:11:14
可以注意到,内存m存在一个最佳值,使模拟数据的自相关性接近真实数据的自相关性。对于第2.3节中描述的WISMC模型,这需要在定义加权指数Uλnin(20)时指定函数f。让我们简要回顾一下,真实市场的波动性是长期的正自相关,然后在时间上聚集。这意味着,在股票市场中,高频金融中存在高和低半马尔可夫模型:回顾130 50 100 150 20000.0050.010.015记忆(m)均方误差图5。真实数据和合成数据的自相关函数之间的均方误差,作为记忆值m的函数。波动。基于这一经验事实,我们假设,转换概率也取决于市场处于高波动期还是低波动期。与索引半马尔可夫模型相比,我们决定使用更合适的F表达式。我们使用返回平方的指数加权移动平均(EWMA),其表达式如下:f(Jn-1.-k、 a,λ)=λTn-aJn-1.-kPn-1k=0PTn-K-1a=Tn-1.-kλTn-a(28),因此指数过程变为λn=n-1Xk=0Tn-K-1Xa=Tn-1.-kλTn-aJn-1.-kPn-1k=0PTn-K-1a=Tn-1.-kλTn-A.(29)指数Uλ也被离散为低、中低、中、中高和高波动性的5种状态。分析中使用的离散化示例如图6所示。鉴于指数函数中存在参数λ,我们测试了作为λ函数的自相关行为。请注意,在定义指数变量时,EWMAI对所有之前的收益平方及其权重进行了计算。在总结所有过去的回报之前,我们决定检查是否存在更好的记忆时间m。

18
何人来此 在职认证  发表于 2022-5-5 07:11:17
出于这个原因,我们也对照其他参数检查了我们的模型。使用此选择公式14 Guglielmo D\'Amico、Filippo Petroni和Flavio Prattico 1 2 3 EwmicontinuousdiscretizedFigure 6。索引值的离散化。(29)的形式为:Uλn(m)=n-1Xk=n-mTn-K-1Xa=Tn-1.-kλTn-aJn-1.-kPn-1k=n-mPTn-K-1a=Tn-1.-kλTn-A.(30)在图7中,我们显示了所分析的四只股票以及不同m和λ的实际和模拟收益(指数过程使用定义(30))之间的∑(τ)均方误差。让我们考虑一下图7所示的结果:m应尽可能大,然后定义(29)是合适的,只要λ小于1,在最后一种情况下,定义(29)相当于无权重的移动平均值,结果在[8]中表示为m。在图8中,我们再次显示了均方误差,但仅作为权重λ的函数,然后使用定义(29)进行指数过程。我们可以注意到,即使λ的最佳值对于所有被分析的岩块都不相同,但对于不同的被分析岩块,其行为非常相似。因为可以看到菲亚特、埃尼、安联和大众的最佳λ值分别为0.96、0.97、0.97和0。分别为98。图9显示了各股票λ最佳值的自相关与实际数据之间的比较。该图显示,真实数据和合成数据对收益平方的自相关函数几乎相同。4.总结:我们通过半马尔可夫模型对金融价格变化进行了建模。我们的工作是由市场中存在的低波动和高波动时期推动的。simplesemi-Markov模型和索引半Markov模型能够捕捉真实数据中收益平方的几乎所有相关性。

19
可人4 在职认证  发表于 2022-5-5 07:11:21
这两个模型之间的比较表明,ISMC模型很好地再现了市场收益的行为,这得益于将过去的波动率用作记忆指数。我们已经证明了高频金融中的时间长度半马尔可夫模型:回顾150 50 10000.010.02Fiat0 50 10000.010.02ENI0 50 10000.010.02Allian0 50 10000.010.02VolksWagenmemory(m)均方误差0.9h 0.92h 0.94h 0.96h 0.98h 1图7。真实数据和模拟数据的自相关函数之间的均方误差,作为m的函数,以及λ.0.9 0.95 100.0050.01Fiat0的不同值。9 0.95 100.0050.01ENI0。9 0.95 100.0050.01安联。9 0.95 100.0050.01大众银行最小错误图8。真实数据和模拟数据的自相关函数作为λ.16 Guglielmo D\'Amico、Filippo Petroni和Flavio Prattico0 50 10000.10.20.3h=0.96Fiat0 50 10000.10.20.3h=0.97ENI0 50 10000.10.20.3h=0.97Allianz0 50 10000.10.20.3h=0.98VolksWagentime(min)相关性的函数之间的均方误差真实数据合成数据图9。分析股票的真实数据(实线)和合成(虚线)时间序列的自相关函数。在重现正确的自相关持久性方面,记忆的变化确实起着关键作用,这表明存在一个最佳值。相反,WISMC模型的结果表明,如果将过去的波动率用作指数加权指数,该模型能够比ISMC模型更准确地再现市场收益行为。

20
能者818 在职认证  发表于 2022-5-5 07:11:24
模型产生的收益是不相关的,而收益的平方呈现出与实际数据非常相似的长期相关性。我们还通过分析来自不同市场(意大利和德国)的不同股票,仅对WISMC模型表明,结果并不取决于为分析选择的特定股票,即使权重值可能取决于股票。我们强调,out模型与ARCH/GARCH家族的模型非常不同。我们不直接将波动性建模为一个相关过程。我们建立了收益率模型,通过考虑半马尔可夫核和以记忆指数和加权指数为条件的半马尔可夫核,可以自由地得出波动率相关性。参考文献[1]N.利米诺斯M.布斯马特诉巴布案。公社。统计理论方法33(2004)2833。[2] Barbu,V.和Limnios,N.(2008年)。半马尔可夫链和隐半马尔可夫模型的应用。Springer Verlag New York Inc.[3]G.D\'Amico,年龄使用半马尔可夫模型,应用数学建模,35,(2011),4354-4366。高频金融中的半马尔可夫模型:综述17[4]G.D\'Amico,J.Janssen,R.Manca。信贷风险管理的齐次半马尔可夫可靠性模型,《经济学和金融决策》,28,(2005),79-93。[5] G.D\'Amico,J.Janssen,R.Manca。欧洲和美国选项:半马尔科夫案例,Physica A,388,(2009),3181-3194。[6] G.D\'Amico,J.Janssen,R.Manca。方法计算机应用程序。12(2) (2010) 215.[7] G.D\'Amico,F.Petroni。价格回报的半马尔可夫模型,Physica A 2012,DOI:10.1016/j.physa。2012.05.040.[8] G.D\'Amico,F.Petroni。《半马尔可夫力学与实验》,G\'D.2009年,《半马尔可夫力学与实验》,第19期。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 10:34