楼主: mingdashike22
3047 87

[量化金融] 金融时间序列的熵分析 [推广有奖]

51
能者818 在职认证  发表于 2022-6-10 07:48:29
这九个收益是图3.2:离散化示例具有绘制状态和离散化结果的九个收益的较大时间序列的一部分。我们希望将其放入分区中。在这里,至少有两种不同的方法来划分数据。第一种方法是遵循文献(如第3.2.2节所述),根据回报的大小将单个回报映射到分区(或字母)。设q(a,b)表示b置信水平下a的分位数。第一种方法是将收益映射如下:dr(rt)=如果rt<q(rt,0.33),则为0;如果q(rt,0.33),则为1≤ rt公司≤ q(rt,0.66)2如果rt>q(rt,0.66)(3.12),由于ris是唯一一个绝对值为负值且较大的回报,因此它很可能是九个回报中唯一一个映射到字母“0”的回报。其他八个回报在绝对值上很小,很可能映射到字母“1”。该映射的结果如图3.2所示为“离散化收益”。或者,由于我们对大额提款和提款感兴趣,我们可以根据其特定类型提款的成员资格来映射收益,而不是单个收益的大小:dD(rt)=如果D(rt)<q(D,0.05),则为0;如果q(D,0.05),则为1≤ D(rt)≤ q(D,0.95)2如果D(rt)>q(D,0.95)(3.13),其中D(rt)表示拉伸的大小,q(D,0.05)是拉伸分布的5%分位数,类似地,q(D,0.95)位于95%分位数。这意味着字母“0”与较大的提取相关联,字母“2”与较大的提取相关联,字母“1”具有所有具有较小提取大小的提取。因此,很可能在我们的示例中,D中的所有返回(即r,rand r)都将映射到字母“0”,而其他六个返回(r,r,r,rand r)将映射到字母“1”。九份申报表中没有大幅度的提款。

52
mingdashike22 在职认证  发表于 2022-6-10 07:48:32
该映射结果如图3.2所示为“离散化绘制”。在前一种情况下,每个分区(或字母)的边际概率将是相同的。对于第二种方法,即我们在这里采用的方法,不能保证边际概率相等,这将取决于抽签规模的分布。让X→ A是离散化的随机变量,其中所有值都组合到M=| A |框中。离散概率分布的熵可以通过计算落入每个箱子的X的相对频率来计算。我们称之为naive熵估计器的估计器可以计算如下。^Hnaive=-MXi=1pi·log(pi)=-MXi=1niN·log(niN)=log(N)-NXini·log(ni)(3.14)如果样本量N很小,统计函数会对熵估计产生偏差,从而产生向下的偏差。格拉斯伯格(2003)对这种“小样本”偏差进行了修正。假设所有pi 1,建议的新估计量Hψ如下:^Hψ=lnN-NMXi=1ni·ψ(ni)(3.15)ψ(x)=d(lnΓ(x))dx,Γ(0,x)=Z∞e-xttdt(3.16)我们将在第3.5.2节中使用此估计器。根据特定的分区选择,各个进程的熵将发生变化。在此,离散化方案(3.13)中分位数的选择决定了将映射过程中的绘制状态的符号。在QT较低的情况下,由于符号分布更不均匀,预计单个过程的熵较低。Q分位数越高,相应的熵越高。这组三个字母的符号序列中的最大熵由均匀三符号分布的熵给出:-3··log()=1.585。两种汇率的熵估计值如表3.4所示。

53
大多数88 在职认证  发表于 2022-6-10 07:48:35
从表3.4中可以看出,最大熵是通过分位数q的划分得到的≈ 0.225,q=1- q≈ 0.775,低于q=。这种情况是因为在离散化中使用了绘制分布的分位数,而不是绘制状态分布的分位数。由于较大的绘制倾向于归属于较小的绘制,从绘制大小定义的分区移动到基于离散绘制状态的分区,将导致分区向较大绘制“倾斜”。传递熵,如方程(3.11)所定义,使用历史块上的熵来确定过程是否相互影响。在本节的剩余部分,我们讨论了H(X | X)的一些结构特征-1.十、-(m+1)),通过离散化定义的汇率过程。图3.3显示了每日欧元/美元提款状态的条件区块熵和区块熵。左图是一个分位数为q=0.05、q=0.95的分区,重点放在大型绘图上。右图表示更为等概率的划分,分位数q=0.15,q=0.85。

54
大多数88 在职认证  发表于 2022-6-10 07:48:39
绝对水平相差2倍,这可以通过符号分布的熵来解释,其中^Hq=0.05(欧元/美元)=0.968分位数q:0.025 0.050 0.075 0.100 0.125 0.150 0.175 0.200 0.225 0.250面板A:每日系列^HEUR/美元(d)0.674 0.968 1.164 1.308 1.411 1 1 1.483 1.531 1.561 1 1 1.58 1.585^HGBP/美元(d)0.66 0.968 1.163 1.315 1.412 1.478 1.532 1.562 1 2 1.58 1.585面板B:小时系列^HEUR/美元(h)0.597 0.89 1.095 1.247 1.362 1.446 1.507 1.549 1.574 1.585^HGBP/美元(h)0.593 0.888 1.0881.242 1.357 1.442 1.504 1.547 1.572 1.584表3.4:每日和每小时欧元/美元和英镑/美元的熵^H分区定义如等式(3.13)所示,分位数q的值范围为:dD(rt)=如果D(rt)<q(D,q),则为0;如果q(D,q),则为1≤ D(rt)≤ q(D,1- q) 2如果D(rt)>q(D,q),且^Hq=0.15(欧元/美元)=1.48(见表3.4)。图3.3:块熵欧元/美元该图显示了无条件H(X,X-1.十、-(m+1))和条件块熵H(X | X-1.十、-(m+1)),对于欧元/美元离散时间序列上m=1到m=9的历史长度。使用了两种离散格式。左侧q=0.05,右侧q=0.15。q=0.05时的条件熵下降速度比q=0.15时的慢。这与抽签长度为E【lD】的结论一致≈ 2(见表3.2 E【ld】、E【lu】的行),但前提是提款处于较高的分位数q=0.05、0.95,欧元/美元提款的平均长度可估计为E【ld | D<q(D,0.1)】=4.03±1.65,而提款的平均长度可估计为E【lu | U>q(U,0.9)】=4.21±1.93。这些结果综合起来表明,大部分大型图纸的长度不超过4.03+1.65≈ 5.68 4.21 + 1.93 ≈ 6.14. 因此,我们希望看到条件块熵在长度超过6.14时达到平台。

55
可人4 在职认证  发表于 2022-6-10 07:48:42
我们将这里的讨论限定为每日欧元/美元系列,因为英镑/美元系列和每小时系列的图片非常相似。3.5实证结果3.5.1欧元/美元和英镑/美元提款之间的相关性我们估计了等式(3.10)中的相互信息,τ=-8.8使用(3.13)中的离散化方案计算每日和每小时汇率回报。对于每日序列和每小时序列,样本量分别约为3000和70000,使用(3.14)中M=3(对于三个字母“0”、“1”、“2”)的naive估计量来估计互信息I。作为对阈值选择(q=0.05,q=1)的稳健性检查- q=0.95)对于离散化方案,我们还根据其他阈值选择计算了互信息。表3.5中报告了每日汇率回报的结果(q=0.045、0.050、0.055),并绘制在图3.4中。从表3.5和图3.4可以清楚地看出,相互信息在τ=0时最高,在τ6=0时急剧下降。对于相同的τ,τ<3的相互信息大于τ>0,表明欧元/美元相对于英镑/美元处于领先地位。为了了解互信息估计对特定分区选择的敏感性,选择了不同的分位数来估计互信息。在表3.5的第二列和第四列中,我们报告了分位数集(q=0.045,q=0.955)和(q=0.055,q=0.945)的估计互信息。在图3.4的右侧,我们报告了滞后τ=-2.-1,0,+1,+2,分位数范围为q=0.025到q=0.35,这近似于等概率情况。表示互信息估计的曲线是连续的,在特定分位数处没有尖峰。

56
能者818 在职认证  发表于 2022-6-10 07:48:46
这在一定程度上保证了分位数的选择不会实质上改变结论。从图3.4^I(Xt,Yt)的右侧也可以清楚地看到-τ) ^I(Xt,Yt-τ),q=0.050lagτq=0.045 q=0.050 q=0.055u(^I(X,Yshu)±σu(^I(XB,YB)|ρ=0.67±^σu(^I(XB,YB)|ρ=0.5±^σ+4 0.00842 0.00871 0.00973 0.00289±0.00203 0.05831±0.04773 0.03105±0.02221+3 0.0101 703 0.01806 0.02037 0.00288±0.00203 0.07152±0.04389 0.03766±0.01956+2 0.03545 0.03876 0.04383 0.00289±0.00203 0.08884±0.03524 0.04595±0.01427+1 0.05595 0.062660.07181 0.00286 ± 0.00198 0.10822 ± 0.02336 0.05398 ± 0.009010 0.07187 0.0832 0.09617 0.00283 ± 0.00194 0.12536 ± 0.01992 0.06029 ± 0.00897-1 0.04303 0.04926 0.05633 0.00275 ± 0.00192 0.10822 ± 0.02336 0.05398 ± 0.00901-2 0.01879 0.02087 0.02278 0.00273 ± 0.00191 0.08884 ± 0.03524 0.04595 ± 0.01427-3 0.00657 0.00718 0.00771 0.00273 ± 0.00189 0.07152 ± 0.04389 0.03766 ± 0.01956-4 0.00415 0.00377 0.00398 0.00272±0.00188 0.05831±0.04773 0.03105±0.02221表3.5:互信息(每日回报)在前三列中,报告了dailyreturn系列离散时间序列的估计互信息^I(欧元/美元,英镑/美元+τ)。离散化方案(3.13)使用分位数q=0.050,并作为分位数q=0.045、0.055的稳健性检查。在最后三列中,给出了三个过程的数值模拟结果。u(^I(X,Yshu)表示该值,其中一个离散时间序列被压缩,破坏了任何相关或互相关信息。在u(^I(XB,YB)|ρ=0.67,0.5列中,使用离散化方案(3.13)计算相关过程的交互信息,相关系数ρ=0.67,0.5。该互信息在滞后τ=0时最高,而在分配滞后时显著较低。

57
何人来此 在职认证  发表于 2022-6-10 07:48:49
与其他分位数值相比,q=0.055和q=0.125之间的信息增加更高。接下来,我们将经验估计与两个相关高斯过程产生的模拟结果进行比较。对于每个模拟的时间序列,基于离散化方案(3.13)计算绘制状态,并应用naive估计器。一个模拟集中使用的相关系数是两个收益序列欧元/美元和英镑/美元的估计无条件相关性,其ρ=0.673(见表3.2)。这使我们能够在高斯回报的简化假设下,定量描述时间序列中相关性对绘图依赖性的排他性影响。结果如图3.4和表3.5第六列所示。在所有滞后条件下,模拟状态的互信息始终显著高于经验序列。一对经验绘制状态序列的较低互信息表明,与具有相同相关系数的一对相关高斯过程相比,经验序列中的大型绘制显示出更高程度的独立性。如果在模拟中考虑进一步的互相关关系,预计模拟图和经验图之间的差异将更大。图3.4:互信息(每日回报)左图显示了滞后τ的^I(欧元/美元,英镑/美元+τ)=-8, . . . + 8和模拟高斯过程。右图^I(欧元/美元+τ,英镑/美元)表示滞后τ=-2, . . . + 2和显示的各种离散化QI。规格如表3.5所示。模拟了另一对相关高斯过程,其相关性较低,^ρ=0.5。特定因子是在实验不同的相关性后设定的,目的是在滞后τ=0时对互信息有一个下界。

58
何人来此 在职认证  发表于 2022-6-10 07:48:52
该模拟的结果也显示在图3.4和表3.5的第七列中。滞后0时,互信息低于经验序列的互信息。此外,在这种设置中,滞后τ6=0时的互信息比经验序列的情况低得多。滞后时间τ∈ {0,1},模拟对的交互信息高于经验序列的相应交互信息。为了量化估计熵(互信息)时的误差,我们重新估计了两个给定时间序列的互信息,但其中一个下面的返回序列是shu-free。shu-free的结果是去除序列之间的任何相关性和互相关。此外,任何自相关信息也会被破坏,导致不同的绘图分布。这是迭代完成的,生成一个shu-free ed系列的示例。离散化程序适用于所有的shu峈ed系列,互信息计算并在图中表示为I(Xshu峈ed,Y)。^I(Xt,Yt)的平均值和标准误差-τ) ^I(Xt,Yt-τ) ,q=0.050lagτq=0.045 q=0.050 q=0.055u(^I(X,Yshu)±^σ[10-3]+5 0.0054 0.00535 0.00538 0.11361 ± 0.081+4 0.01163 0.01157 0.01131 0.1123 ± 0.079+3 0.02479 0.02441 0.02409 0.11351 ± 0.08+2 0.05141 0.05184 0.05274 0.11517 ± 0.081+1 0.09124 0.09409 0.09865 0.11619 ± 0.0830 0.13581 0.14376 0.15415 0.11131 ± 0.079-1 0.08763 0.09058 0.09585 0.1114 ± 0.078-2 0.04873 0.04992 0.05228 0.11103 ± 0.077-3 0.0234 0.02408 0.02529 0.1116 ± 0.077-4 0.01134 0.01182 0.01255 0.11147±0.079-5 0.00598 0.00633 0.00663 0.11182±0.081表3.6:小时回报的互信息在前三列中,报告了离散化小时回报序列的估计互信息^I(欧元/美元,英镑/美元+τ)。

59
mingdashike22 在职认证  发表于 2022-6-10 07:48:55
离散化方案(3.13)已在分位数q=0.050时使用,并在分位数q=0.045、0.055时用作稳健性检查。u(^I(X,Yshuêed)显示值,其中一个离散化时间序列被刷新,破坏了任何相关或互相关关系。计算了松脂样品。图3.4中的左图显示了平均值以及经验时间序列的估计互信息。滞后τ=-4, . . . + 表3.5中报告了4个。从图3.4可以看出,shu’ed系列的互信息非常低。仅适用于滞后|τ|≥ 6经验系列的互信息^I是否低于shuêed系列中包含的互信息水平。我们对小时汇率重复上述程序,并在表3.6中报告结果。小时关系的结果与上述每日回报的结果相似,互信息I在τ=0时达到峰值,而τ6=0时下降。τ<0时的I略高于τ>0时的等效|τ|。与每日收益一样,我们测试了结果对分位数选择的敏感性。表3.6显示了不同滞后τ=-5, . . . + 每小时序列的估计^I包含的信息水平高于τ=0和其他短|τ|的每日绘制状态序列。因此,在同期和短期滞后时,小时回报率之间存在较强的依赖性。3.5.2欧元/美元提取和英镑/美元转移熵之间的信息流可以表示为两个区块熵的差异,如等式(3.11)所示。

60
nandehutu2022 在职认证  发表于 2022-6-10 07:48:58
在这里,我们使用方程(3.13)中定义的三字母划分和方程(3.15)中的格拉斯伯格估计量^Hψ来估计转移熵。由于小样本的传递熵不为零,我们遵循Marschinskiand Kantz(2002)的方法,通过bootstrappingmethod估计平均值和标准误差,包括重新调整预测序列,并破坏其所有时间序列模式。该过程重复足够多次,然后计算平均值u(^Tsh)和标准偏差σ,调整后的有效传递熵(ET)计算为:ETY→X(m,l)≡ 泰→X(m,l)- u(^Tsh)(3.17)表示ETY→X(m,l),m指的是X中自己过去历史的长度,l指的是Y过去历史的长度,用于预测X。ET form=1。4且l=1。4如图3.5所示。表3.7和表3.8中列出了更重要案例(即,由最暗块表示)的详细统计数据。从图3.5中,我们注意到,对于固定的m,ET通常随着l的增加而增加。另一方面,对于相同的l,如果可以使用X自身的过去更有效地预测X,则ET可能会随着减少而减少。对于图3.5、表3.7和表3.8所示的结果,我们得出的结论是,欧元/美元的最大值→英镑/美元,m=2,l=4,而对于^ETGBP/美元→欧元/美元,m=1,l=4。从这两种汇率的^ET金额来看,从英镑/美元到欧元/美元的信息流略多于从英镑/美元到欧元/美元的信息流。请注意,图3.5中的有效传递熵为负值,这是因为从shu-free ing得到的估计传递熵高于原始时间序列。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-24 19:00