楼主: 何人来此
940 22

[量化金融] 金融数据的索引马尔可夫链:测试 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-6 20:04:43
两个或多个变更点的情况可以从迄今为止所示的单个变更点的估计方法进行扩展。设ψ<ψ<···<ψkbe k在区间[Ef,Ef]中定义的变化点。k个变化点的每个可能组合将间隔划分为k+1个子间隔:【Ef,ψ】=:I(s)(ψ,ψ】=:I(s)。。。(ψr)-1,ψr】=:I(s)r。。。(ψk,Ef)=:I(s)k+1。对于k+1子间隔中间隔的每个(s)可能分区I(s)rk+1r=1,必须估计k+1转移概率矩阵^P(s),其(i,j)元素为:^P(s)i,j;r=PTn=1{Jn-1=i,Jn=j,Vmn-1.∈I(s)r}PTn=1{Jn-1=i,Vmn-1.∈I(s)r}=:N(s)I,j;rN(s)i;r、 (12)在[0,T]周期上观察到的样本x的似然函数为:L(s)(P(s),P(s),P(s)k+1;x) =k+1年=1年,j∈EP(s)i,j;rN(s)i,j;r、 (13)然后可以计算对数似然函数,即L(s)=log(L(s))=L(s)+L(s)+···+L(s)k+1=k+1Xr=1L(s)r,(14)其中L(s)r:=L(Psr,x)是参考子区间Ir的一般(s)分区的对数似然。如上所述,可以以迭代的方式计算k变化点的值。我们设置ψ的n个离散且不同的值∈ [Ef,Ef]。注意,对于k个变化点,我们有n-1公里变化点向量的可能组合(ψ,ψ,…,ψk)。该方法与一个变化点的方法基本相同,但在这种情况下,我们必须考虑k个变化点集(ψ,ψ,…,ψk)的所有可能组合。估算值可通过以下公式计算:(ψ,ψ,…)。

12
大多数88 在职认证  发表于 2022-6-6 20:04:46
,ψk)=arg max{(ψ<ψ<····<ψk)∈ 【Ef,Ef】:L(s)}(15)在这种情况下,可以进行试验,其中:H: P=P=···=PkH:Pi6=pj对于一些i 6=j(16),检验统计量可计算如下:D(s)=2*hk+1Xr=1L(s)r- L(P)i(17),其中L(P)是在样本x上没有变化点的情况下的对数似然值,因此估计单个转移矩阵P。bootstrapmethodology可再次用于获得统计检验理论分布的近似值。如果变化点的数量未知,还需要对其进行估计,从而可以使用AIC或BIC等度量。AIC目标函数由以下公式得出:AIC(k)=2* | E |*(| E |-1) * (k+1)- 2.*k+1Xr=1LMr(18),其中olm是ψ,ψ,…,的最大似然估计的对数似然值,ψk存在k个变化点的条件o| E |是马尔可夫链的状态数ok是变化点数。变化点的估计数量由以下公式给出:^kAIC=arg min{k∈ {1,2,…,n}:AIC(k)}。(19) 或者,可以使用BIC标准:BIC(k)=2* 日志(n)* | E |*(| E |-1) * (k+1)- 2.*k+1Xr=1LMr。(20) 变化点的估计数量由以下公式给出:^kBIC=arg min{k∈ {1,2,…,n}:BIC(k)}。(21)4. 预测下一步的指数值假设我们已确定指数马尔可夫链{Jn}n的k个变化点∈确保:ψ<ψ<···<ψk;ψi∈ Ri=1,2,k、 因此,我们估计了k+1转移概率矩阵,表示为:P(v)=(pij(v))i,j∈E、 五∈Rwhere pij(u)=pij(v)如果一∈ {1, 2, . . .

13
大多数88 在职认证  发表于 2022-6-6 20:04:50
k- 1} 使得ψa<u≤ ψa+1;ψa<v≤ ψa+1。这意味着,如果u,v属于相同的区间Ia+1:=(ψa,ψa+1),其中i=(-∞, ψ] 和Ik+1=(ψk+∞], 那么P(u)=P(v)。在时间s,应用模型所需的信息是返回过程iss过去状态的向量-m+1:={是-m+1,is-m+2,是-1,is}。一旦向量iss-m+1已知,我们可以计算索引进程的值:Vms=Pm-1k=0f(Js-k) m=Pm-1k=0f(is-k) m.(22)让我们定义一下:Tiss-m+1(Ia):=inf{n≥ s、 n个∈ 编号:Vmn∈ Ia | Jss-m+1=iss-m+1},(23)作为索引过程进入一般区间Ia=(ψa)的第一次(当前时间s的连续时间)-1,ψa]。还有letgiss-m+1(Ia;s+n)=P(Tiss-m+1(Ia)=s+n | Jss-m+1=iss-m+1),(24)是Indexprocess中Iaof中首次进入时间的概率分布。让我们假设那是Giss-m+1(Ia;s)=0;Ia,国际空间站-m+1,则以下结果成立:命题1。(g的显式公式)giss-m+1(Ia;s+n)=Ec,EX(is+1,…,is+m-1) ,is+nnYr=1Pis+r-1,is+r下午-1k=0f(is+r-1.-k) m级,(25)其中,符号EC,EX(is+1,…,is+m-1) ,is+n:=Xis+1∈Ecis公司-m+1(Ia)Xis+2∈Ecis公司-m+2(Ia)·Xis+m-1.∈Ecis+n-2秒-m+(n-1) (Ia)Xis+n∈Ecis+n-1秒-m+n(Ia)安第斯山脉-m+1(Ia):={k∈ E:Pm-1k=0f(is+1-k) m级∈ Ia},还有Eciss-m+1(Ia)是EIS的补充-m+1(Ia)。证据首先应该指出的是,EIS-m+1(Ia)是空间状态E的子区间,通过估计iss-m+1,让索引进程在间隔Ia中输入下一个转换。接下来,我们可以开始用数学归纳法来证明这个结果。对于n=1,命题1为真。

14
何人来此 在职认证  发表于 2022-6-6 20:04:54
事实上:giss-m+1(Ia;s+1)=P(Tiss-m+1(Ia)=s+1 | Jss-m+1=iss-m+1)=Xis+1∈EP(Tiss-m+1(Ia)=s+1,J(s+1)=is+1 | Jss-m+1=iss-m+1)=Xis+1∈EP(Vms+1∈ (Ia),J(s+1)=is+1 | Jss-m+1=iss-m+1)=Xis+1∈EP(Vms+1∈ (Ia)| Js+1s-m+1=is+1s-m+1)* P(J(s+1)=is+1 | Jss-m+1=iss-m+1))=Xis+1∈EIS-m+1(Ia)1* Pis,is+1下午-1k=0f(is-k) m级,(26)对于n=1,等于公式(25)。现在,让我们假设介词1对n是真的- 1,这意味着:giss-m+1(Ia;s+m-1) =Ec,EX(is+1,…,is+m-2,is+m-1) (s+m-1)-sYr=1Pis+r-1,is+r下午-1k=0f(is-k) m级.我们可以计算:giss-m+1(Ia;s+n)=P(Tiss-m+1(Ia)=s+n | Jss-m+1=iss-m+1)=Xis+1∈Eciss公司-m+1(Ia)P(Tiss-m+1(Ia)=s+n,J(s+1)=is+1 | Jss-m+1=iss-m+1)=Xis+1∈Eciss公司-m+1(Ia)P(Tiss-m+1(Ia)=s+n | J(s+1)=is+1,Jss-m+1=iss-m+1)* P(J(s+1)=is+1 | Jss-m+1=iss-m+1)(27)=Xis+1∈Eciss公司-m+1(Ia)P(Tiss-m+1(Ia)=s+n | Jss-m+1=iss-m+1)* Pis,is+1下午-1k=0f(is-k) m级=Xis+1∈Eciss公司-m+1(Ia)gis+1s-m+2(Ia;s+n)* Pis是+1下午-1k=0f(is-k) m级= (来自归纳假设)=Xis+1∈Eciss公司-m+1(Ia)Ec,EX(is+2,…,is+m-2) ,is+m-1s+n-(s+1)年=1个IS+1-r-1,is+1+r下午-1k=0f(is+1,r-1.-k) m级* Pis,is+1下午-1k=0f(is-k) m级,(28)后者与公式(25)一致。5、实证研究迄今为止所述的方法已应用于埃尼集团(一家意大利上市公司)的日内价格研究。价格样本数据自2007年1月1日起至2010年12月31日止。数据集可从www.borsaitaliana获取。它包含交易股票的逐笔报价。数据已重新采样,频率为1分钟。对数回报率是根据研究中金融资产的价值计算得出的,序号:Rn=log(序号/序号-1) 然后通过式(1)给出的映射进行离散化。根据文献[8],回报被离散为5种状态,选择与回报相等的对称状态,并保持分布形状不变。

15
nandehutu2022 在职认证  发表于 2022-6-6 20:04:57
根据[8]f中相同作者得出的结果,方程式2中定义的结果被选择为仅等于J。m的值固定为30分钟的beequal。然后,指数过程Vmni由过去30分钟内收益平方的移动平均值给出。指数值表示价格波动的水平:指数值越高,图1:在一个变化点价格波动的情况下,指数过程的离散化程度越高。首先,让我们假设波动率只有两个级别:高和低。因此,索引过程也应离散化为这两种状态。为了检测将过程细分为两种状态的指数的最佳值,我们使用了这样一个事实,即价格回报过程{Jn}基于波动性水平呈现不同的动态,即不同的转移矩阵。因此,在我们的工作中,变化点被确定为指数的价值,这将最大化价格回报动态中的差异。由于没有确定变化点的闭合形式,我们使用第3节中描述的最大似然法进行运算。计算了该指数在每种状态下的估计变化点和价格-收益过程的两个概率矩阵。图1显示了通过使用通过最大对数似然法确定的变化点在两种状态下对指数过程的离散化。金融时间序列的一个众所周知的特征是“波动性聚类”,它简单地说明了市场的高/低波动期之后往往是高/低波动期。

16
何人来此 在职认证  发表于 2022-6-6 20:05:00
指出这一特征是通过分析以下两个转移概率矩阵得到证实的,这似乎是有用的:^P(ψ)=0.173 0.151 0.207 0.218 0.2510.129 0.196 0.267 0.255 0.1530.137 0.209 0.300 0.221 0.1330.150 0.246 0.275 0.204 0.1250.237 0.215 0.218 0.159 0.171;^P(ψ)=0.067 0.162 0.312 0.338 0.1210.031 0.183 0.391 0.347 0.0480.033 0.236 0.466 0.234 0.0310.049 0.339 0.397 0.185 0.0300.110 0.338 0.316 0.170 0.066事实上,可以注意到,在高波动性的情况下,过渡矩阵^P(ψ)对于最极端状态的概率高于过渡矩阵^P(ψ)。这简单地证实了一个事实,即在高波动性市场中,经历资产价格巨大变化的概率(即强正回报后强负回报,反之亦然)高于低波动性的情况。一旦矩阵得到估计,下一步就是确定它们在统计上是否存在差异。为此,我们计算了两个指数,可用于衡量两个矩阵之间的差异。特别是,我们使用了百分比均方根偏差(%RSMD)和百分比平均绝对偏差(%MAD)。公式分别在公式29和公式30中给出。%RSMD=sPij(pij- pij)n*n* 100%Pijpij,(29)%MAD=Pij | Pij- pij | Pijpij* 100%,(30)结果如表1所示。因为,这两个指数的值是估计矩阵差异的度量,指数的值越高,两个矩阵之间的距离越大,过程中实际存在差异的可能性越高。下一步是测试两个转移概率矩阵在统计上是否不同。

17
能者818 在职认证  发表于 2022-6-6 20:05:04
为了构建测试,我们使用第3节中描述的程序。表1:均方根偏差和绝对平均偏差矩阵%RSMD%MAD^P(ψ),^P(ψ)49.3%44.2%-3000-2000-1000 0 1000 2000 3000001020304050607080直方图-3000-2000-1000 0 1000 2000 300000.511.522.533.544.55x 10-4Kernel拟合图2:经验统计检验的直方图和核拟合表2:一个变化点ψD D的统计检验结果*(0.95)D*(0.99)经验p值1.23 32400 3290 3580 0.000如前所述,在零假设下的统计检验分布未知,因此必须通过引导法进行近似。我们已经模拟了1000条相同长度数据的轨迹,这些轨迹来自一个转移概率矩阵,该矩阵是在考虑整个数据集的情况下估计的。模拟统计检验和核拟合的直方图如图2所示。我们选择了5%的显著性水平。表2显示了库存单一变化点的测试结果。D*(0.95)和D*(0.99)来自模拟分布,分别代表95%和99%置信水平下的统计检验值。由于不存在统计检验的理论分布,因此不存在理论p值,我们也从模拟分布中获得了p值,并将其报告为“经验”p值。统计检验的结果强烈建议不要接受零假设,因此我们得出结论,两个传递概率矩阵之间存在统计差异。还考虑了不止一个变更点的情况。程序与迄今为止描述的一个变更点的情况相同。主要区别在于,在这种情况下,基于AIC和BIC的方法在公式中定义。

18
kedemingshi 在职认证  发表于 2022-6-6 20:05:07
(19) 和式(21)可分别用于确定最节省的模型。如前所述,不存在计算最佳变化点数量的闭合形式,因此我们以迭代方式进行操作。应该注意的是,该算法非常缓慢地达到AIC或BIC的最小值。我们还决定根据两个指数的百分比变化计算额外变化点的改善。表3:SK 1 2 3 4 5D 32400 42000 46100 48300 49800% 29.6%9.8%4.8%3.1%AIC 1379000 1370000 1365000 1363000 1362000% -0.7%-0.4%-0.1%<-0.1%BIC 1380001371000 1367000 1366000 1365000% -0.7%~0.3%<-0.1%<-0.1%表4:五个变化点ψψψ值0.70 1.00 1.40 2.10我们认为小于0.1%的限制是算法达到最小值的标志。结果汇总在表3中。由于BICindex的改善水平低于0.1%,我们确定最佳变化点数量为4个。因此,指数过程分为五种状态,代表市场的五个波动水平:极低、中低、中高和极高。表4给出了在四个变化点情况下获得的索引过程的边界值,图3以图形表示,其中它们与索引过程一起表示。一旦确定了最佳变化点数量,就可以通过最大似然估值器估计每个波动状态下价格回报过程的概率转移矩阵。

19
大多数88 在职认证  发表于 2022-6-6 20:05:10
估计矩阵如下所示。^P(1)=0.046 0.143 0.351 0.378 0.0820.014 0.141 0.445 0.374 0.0260.016 0.219 0.532 0.217 0.0160.027 0.365 0.448 0.146 0.0140.084 0.360 0.358 0.147 0.051;^P(2)=0.064 0.162 0.314 0.344 0.1160.033 0.202 0.375 0.340 0.0500.039 0.249 0.429 0.248 0.0350.053 0.333 0.382 0.199 0.0330.107 0.343 0.321 0.169 0.0600 1 2 3 4 5x 10500.511.522.533.54指数值指数过程的最佳离散化图3:指数过程的最佳离散化^P(3)=0.091 0.171 0.279 0.304 0.1540.067 0.215 0.321 0.308 0.0890.073 0.248 0.367 0.245 0.0670.086 0.300 0.332 0.222 0.0600.135 0.312 0.283 0.182 0.088;^P(4)=0.150 0.166 0.224 0.238 0.2220.127 0.199 0.269 0.256 0.1490.138 0.208 0.298 0.222 0.1340.150 0.245 0.276 0.206 0.1230.206 0.236 0.245 0.172 0.141^P(5)=0.239 0.121 0.153 0.155 0.3320.232 0.151 0.182 0.169 0.2660.241 0.142 0.207 0.168 0.2420.249 0.168 0.182 0.161 0.2400.320 0.150 0.155 0.130 0.245表5:均方根偏差:四个变化点^P(1)^P(2)^P(3)^P(4)^P(5)^P(1)0.0%20.1%35.8%59.4%100.5%P(2)20.1%0.0%16.8%43.0%86.1%P(3)35.8%16.8%0.0%27.1%70.9%P(4)59.4%43.0%27.1%0从这些矩阵中可以得出%44.1%P(5)100.5%86.1%70.9%44.1%0.0%的显著结果:表6:平均绝对偏差:四个变化点P(1)P(2)^P(3)^P(4)^P(5)^P(1)0%17.2%32.2%53.4%90.1%P(2)17.2%0.0%15.2%38.6%80.6%P(3)32.2%15.2%0.0%25.2%67.7%P(4)53.4%38.6%25.2%42.6%P(5)90.1%80.6%67.7%42.6%0.0%opi,3(h)>pi,3(h+1)对于所有i∈ E和h∈ {1, 2, 3, 4}.

20
大多数88 在职认证  发表于 2022-6-6 20:05:13
这个不等式表明,下一个交易的状态3(零回报)占有率相对于波动率具有递减的概率;o就我而言∈ E和h∈ {1,2,3,4}π,5(h)<π,5(h+1)和π,1(h)<π,1(h+1)。这些不平等表明,以大(负或正)回报为特征的国家更有可能存在高波动性;o对于所有h∈ {1,2,3,4,5}和i∈ {1,2},pi,1(h)+pi,2(h)<pi,4(h)+pi,5(h)。对于所有h∈ {1,2,3,4,5}和i∈ {4,5},pi,1(h)+pi,2(h)>pi,4(h)+pi,5(h)。这意味着,独立于波动率制度(h∈ {1,2,3,4,5}),低返回状态的占用(i∈ {1,2})增加了下一个跃迁达到高返回状态(j)的概率∈ {4,5}),反之亦然,高返回状态的占用(i∈ {4,5})增加了下一个跃迁达到低返回状态(j)的概率∈ {1, 2}). 因此,我们可以确认,退货流程意味着归还财产;o尽管如此∈ {1,2,3}p3,1(h)+p3,2(h)>p3,4(h)+p3,5(h),也就是说,对于从零返回状态(i=3)开始的中低波动性水平,更可能在下一次转换中达到低返回状态(j∈ {1,2})高于高返回状态(j∈ {4, 5}). 对于所有h∈ {4,5}p3,1(h)+p3,2(h)<p3,4(h)+p3,5(h),即对于零返回状态(i=3)的高挥发性水平,更可能在下一次过渡时达到高返回状态(j∈ {4,5})比低返回状态(j∈ {1, 2}).金融时间序列呈现出一个非常重要的特征:虽然回报率不是自相关的,但回报率的平方或其绝对值是长期相关的。重要的是,描述此类动态的模型应具有相同的特征。各种时滞的收益平方的自相关,我们将用τ表示,由公式给出。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 13:34