楼主: 大多数88
499 14

[量化金融] 伪季节性检测:一种非参数测试方案 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-9 17:17:38
然后,我们在时间序列中取第一个差值,以获得相应的分馏高斯噪声(fGn)。赫斯特指数H表征了时间序列与其平均值的累积偏差范围的标度行为。长程依赖性的研究可以追溯到赫斯特(1951)的开创性论文,其原始方法被应用于检测水文时间序列中的长记忆。Mandelbrot和Wallis(1968年)也探索了这种方法,后来Mandelbrot(1972年)在经济时间序列研究中引入了这种方法。如果第一个差异序列是白噪声,则其H=0.5。或者,大于0.5的Hurst指数反映持续过程,小于0.5的反持续过程。我们对每个H值进行1000次模拟,包括10000个数据点。相应地,我们获得2000个“周”,这将分为5个!=120种可能的模式。如果潜在的随机过程是纯随机且不相关的,那么模式的频率应该是一致的。相反,如果存在某种相关性,则某些模式可能优于其他模式。所有测试均以5%的显著水平进行。在表2中,我们检验了模式的相等性(假设1)。当H=0.5(普通高斯噪声)时,平均而言,我们无法拒绝模式出现相等的零假设。在1000个模拟中,只有50个案例否定了无效假设。当我们离开H=0.5时,在两个方向上,拒绝几乎对称地增加。这清楚地表明,某种相关性会影响顺序模式的分布。表1:顺序模式。模式中的每个数字{0,1,2,3,4}代表一周中的一天,从周一开始。

12
大多数88 在职认证  发表于 2022-6-9 17:17:41
数字在Apatern中的位置表示一周内收益的递增顺序。PXX模式PXX模式PXXPXXPXX模式PXX模式1 01234 25 10234 49 20134 73 30124 97 401232 01243 26 10243 50 20143 74 3014298 401323 01324 27 10324 51 20314 75 30214 99 402134 01342 28 10342 52 20341 76 30241 100 402315 01423 29 10423 53 20413 77 30412 101 403126 01432 30 10432 54 20431 78 30421 102 403217 02134 31 12034 55 21034 79 31024 103 410238 02143 32 12043 56 21043 80 31042 104 32902314 33 12304 57 21304 81 31204 105 4120310 02341 34 12340 58 21340 82 31240 106 4123011 02413 35 12403 59 21403 83 31402 107 4130212 02431 36 12430 60 21430 84 31420 108 4132013 03124 37 13024 61 23014 85 32014 109 4201314 03142 38 13042 62 23041 86 32041 110 4203115 0321439 13204 63 23104 87 32104 111 4210316 03241 40 13240 64 23140 88 32140 112 4213017 03412 41 13402 65 23401 89 32401 113 4230118 03421 42 13420 66 23410 90 32410 114 4231019 04123 43 14023 67 24013 91 34012 115 4301220 04132 44 14032 68 24031 92 34021 116 4302121 04213 45 14203 69 24103 93 34102 117 4310222 04231 46 14230 70 24130 94 34120 118 4312023 04312 47 14302 71 24301 95 34201 119 4320124 04321 48 14320 72 24310 96 34210 120 43210如前一节所述,此分析不有效。因此,我们继续检验假设2,并在表3中给出相关结果。我们对每个样本和样本的平均值检验假设(每个H值)。我们发现,对于H=0.5,我们不能拒绝零假设。事实上,1000个样本中只有51到59次出现拒识。换句话说,当生成的随机过程是白噪声时,任何一天都同样容易占据模式中的任何位置。也就是说,任何一天都可能表现出本周最好或最差的回报,或其中的任何中间值。

13
可人4 在职认证  发表于 2022-6-9 17:17:45
当我们离开值0.5时,拒绝率会增加。然而,H>0.5的影响比H<0.5的影响更大。这可能意味着正长期相关性(即持续时间序列)比反持续时间序列更有可能表现出一周中的某一天的行为。此外,周一、周三和周五是受H值变化影响最大的日子。关于假设3,结果如表4所示。在不相关过程(H=0.5)的情况下,人们会发现一个交易周内的收益率的好坏与一周中的哪一天无关。这一假设在1000次模拟中仅被拒绝59次。当我们离开,然后相关性变得更强时,模式会表现出某种程度的偏好,从而增加拒绝的数量。与Hypothesis 3的情况一样,在持续时间序列的情况下,拒绝更频繁。假设4检验了周一回报率最大的模式是否符合均匀分布。有24种模式,其中星期一是最后一个元素。因此,其预期频率为0.2。表5显示了模拟结果。在纯高斯噪声的情况下,我们不能拒绝零假设,因为在1000次试验中,只有117次我们拒绝了它。然而,增加赫斯特指数会导致拒绝次数增加。此外,我们观察到,更大的赫斯特值与更高的模式观察频率相关,其中周一的回报率最大。然而,我们不能拒绝零假设,直到lh=0.8或更高。假设5检验了每周季节性的存在,周一是本周最小的回归日,周五是最大的回归日。这种结构有6种模式。与前面的发现类似,对于不相关的噪声,这种模式既不是首选模式,也不是罕见模式。

14
nandehutu2022 在职认证  发表于 2022-6-9 17:17:48
然而,赫斯特指数的增加会导致拒绝数量的快速增加:当H=0.7时,1000个拒绝中有309个拒绝。更令人印象深刻的是,这种模式在大多数模拟中是多么受欢迎。对于H=0.6,在698次模拟中,这6种模式的观测频率高于预期,对于H=0.7,po>pein873次模拟。符号分析可以有效地检测数据中的非平凡隐藏关联。如Rosso et al.(2012)所示;Carpi等人(2010年)分数高斯噪声过程产生的相关结构会产生不均匀的模式。如果时间序列足够长,则不禁止任何模式。然而,强相关结构产生了优先和罕见模式的出现。表2:假设1对模拟序列H0.1χ224.82856的检验***0.6χ20.42699#拒收1000#拒收3480.2χ140.50932*0.7χ86.57005#拒收1000#拒收9960.3χ67.895480.8χ204.51209***#拒收970#拒收10000.4χ18.107400.9χ386.14031***#拒收317#拒收10000.5χ0.13315#拒收50*,**,***: 在10%、5%和1%的水平上显著。我们的人工时间序列比经济学中常用的数据集要大。因此,假设5中评估的首选模式的存在使人们对一周中某一天之前发现的有效性产生了怀疑。特别是,我们声称,从我们的结果来看,weeke effect的日期主要是由相关数据的复杂相关结构产生的。5实证应用我们使用纽约证券交易所综合价格指数1966年1月3日至2017年12月8日的每日数据,共进行13550次观察。本文中使用的所有数据都是从数据流中检索的。我们将样本分为四个等长的非重叠时段(3050个数据点),最后一个时段为1350个数据点,以验证季节效应的时间演变。

15
可人4 在职认证  发表于 2022-6-9 17:17:51
我们计算每日日志返回以应用我们的测试。关于假设1(见表7),我们发现,在整个样本中,没有禁止的模式。在这些情况下,我们应该摒弃时间序列中的混沌行为(Rosso et al.(2012)),绝对频率等于7的最小频率模式是42013(即rF r<rW e<rMo<rT u<rT h)。绝对频率为34的最常见模式分别为03421和04312(即rMo<rT h<rF r<rW e<rT u和rMo<rF r<rT h<rT u<rW e)。如第2节所述,如果数据是随机生成的,即如果不存在季节性影响,则模式应均匀出现,构成均匀分布的直方图。然而,如图1所示,我们的分布远非均匀分布。表8显示了假设2和假设3的频率和检验。按照表格的水平线,我们测试某一天是否在本周收益中占据任何位置。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 21:08