楼主: mingdashike22
941 21

[量化金融] 波动率同质化金融时间序列的可预测性 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-6 09:36:07
xn(S)真概率的贝叶斯近似*Θ*) 是混合概率:^PD,mix(xn)=Xsπ(S)ZPS,Θ(xn)π(Θ| S)dΘ(8),其中PS,Θ(xn)是(xn)在具有suffix集S和参数向量Θ的树过程分布下的概率。我们需要一个近似值,因为我们不知道Θ,因此我们无法知道真实的概率。(8)中的表达式不可能直接计算,因为深度的suffix集合的数量≤ D等位命令2D。这对于任何D>20的实际使用来说都是非常大的。CTW算法是一种计算(8)中混合概率的有效方法,给出了先验分布π(S)、π(| | S)的特定选择。S上的先验是π(S)=2-|S|-N(S)+1(9),其中| S |是S的元素数,N(S)是S中长度严格小于D的字符串数。给定一个suffix集S,在Θ上的先验是乘积(,)-Dirichlet分布,即在π(Θ| S)下,每个Θ是独立的,每个Θ都是独立的~狄里克莱(,)。在这种情况下,后一个先验是共轭的,而前一个先验是极限共轭的。重要的是,CTW算法能够精确计算(8)中的概率。计算复杂度随字符串长度呈线性增长。因此,与使用插件估计器相比,研究D muchhigher的长度是可能的。最后,给出一个二进制字符串xn,CTW熵率估计器^hctwi给出:^Hctw=-nlog^PD,mix(xn)(10),其中^PD,mix(xn)是(8)中由CTW算法计算的混合概率[27,28]。对于完全可预测的时间序列,^hctw的取值范围为0,对于基数为2的完全随机(不可预测)时间序列,取值范围为1;对于基数为4的时间序列,取值范围为0(可预测)到2(不可预测)。三、

12
nandehutu2022 在职认证  发表于 2022-5-6 09:36:10
实证研究在我们的研究中,我们估计了在华沙证券交易所(GPW)交易的358种证券(所有连续上市超过1000天的证券)的每日价格时间序列的熵。数据已从http://bossa.pl/notowania/metastock/and截至2013年7月5日更新。数据以分析价格变动的标准方式进行转换,即数据点是连续每日收盘价之间的对数比率:rt=ln(pt/pt-1) 为了估计的目的,这些数据点被离散成两个和四个不同的状态。这些状态代表一半或四分位,因此每个状态被分配相同数量的数据点。这种设计意味着模型没有不必要的参数,这可能会影响使用数据时得出的结果和结论。这种和类似的实验装置已用于类似的研究[29]。二元字母表忽略了波动率聚类,因此我们可以通过比较二元字母表和四元字母表的结果来注意到结果的哪一部分来自于这种机制。波动率均一化设计用于日内回报,因此我们还将发现另一组数据的高频价格变化的可预测性,即华沙证券交易所上市的707种证券的日内价格变化(交易水平),记录了超过2500个价格变化(所有证券至少记录了2500个价格变化)。与日常数据不同,我们忽略了没有价格变化的数据点,因为这些数据点对于由非常小(不统一)的时间间隔分隔的数据点没有意义。因此,我们估计下一次价格变化的可预测性。

13
kedemingshi 在职认证  发表于 2022-5-6 09:36:15
从日常数据来看,这样的删减是无关紧要的。在对数收益率本身上,我们对δ的各种值进行了波动率均化分解:0.05、0.1、0.25、0.5、0.75和1。很明显,我们用最后提到的δ值来观察的整个货币单位的价格变化是以非常低的速度发生的,因此得到的时间序列将比最初的时间序列短得多。因此,我们将日内数据的结果限制为265次序列,δ=1至少有1000次变化。它是由CTW估计器的需求所驱动的,CTW估计器对于很短的时间序列不会给出可信的结果。首先,我们想看看分解的时间序列是否比原始时间序列更容易预测。为此,我们将265只股票的Shannon熵率分布(以核密度的形式)与离散为二进制字母的原始时间序列进行了比较(我们不是在与四个字母的字母表进行比较,因为这样熵率会有不同的标度,因为波动率均化会给出二进制时间序列),以及上述δ值的分解级数。在图1中,我们展示了日内时间序列的核密度。从左到右,这些代表波动率均化分解的二元时间序列,δ:0.05、0.1、0.25、0.5、0.75和1,右边的最后一个代表离散为两种状态的原始时间序列。在图2中,我们给出了每日时间序列的核密度(358s)。类似地,从左到右,这些代表性波动率均化分解的二元时间序列δ:0.05、0.1、0.25、0.5、0.75和1,右边的最后一个代表离散为两种状态的原始时间序列。

14
kedemingshi 在职认证  发表于 2022-5-6 09:36:18
我们再次注意到,熵率的低值意味着高可预测性。0.0 0.5 1.010 12股票的熵率(CTW)数量86420图。1.日内对数收益估计的香农熵率的核密度,特别是从左到右:波动率均化分解的二元时间序列,δ:0.05、0.1、0.25、0.5、0.75和1,以及原始二元时间序列。熵率的高值表示低可预测性。其次,我们想看看这种方法在参数选择方面的稳健性,或者换句话说,我们想看看参数δ的选择是显著改变结果,还是仅仅调整结果。为此,在图3中,我们展示了原始日内时间序列离散为两种和四种状态,以及分解的日内时间序列与上述δ值之间的皮尔逊相关系数。英菲格。4我们对每日时间序列也显示了相同的结果。最后,我们直观地(使用散点图)展示了如何实现上述原始时间序列和分解时间序列的香农熵率之间的负相关,以便更直观地理解其含义。在图5中,我们展示了为原始每日时间0计算的沙农熵率之间的关系。0.5 1.010熵率(CTW)股票数量80 2 6图。2.每日日志收益估计的香农熵率的核密度,特别是从左到右:挥发同质化分解的二元时间序列,δ:0.05,0.1,0.25,0.5,0.75&1和原始二元时间序列。

15
大多数88 在职认证  发表于 2022-5-6 09:36:22
熵率的高值表示低可预测性。0.4 1.00.89-0.230.00 0.25-0.19-0.150.1 0.3-0.09-0.150.1 0.40.5 1.5-0.140.4 1.0-0.17-0.14-0.11-0.04-0.10-0.090.98 0.91 0.82 0.780.05 0.250.770.00 0.250.96 0.88 0.84 0.830.97 0.950.05 0.300.940.1 0.30.98 0.970.0 0.30.990.5 1.50.10.40.05 0.25 0.05 0.30 0.3 VHδ=1 VHδ=0.75 VHδ=0.5 VHδ=0.25 VHδ=0.1 VHδ=0.05Logreturns[4]图3]。日内对数收益估计的香农熵比之间的皮尔逊相关性:原始二元时间序列、原始四元时间序列和波动率均化分解的二元时间序列,δ:0.05、0.1、0.25、0.5、0.75和1。序列离散为四种状态,波动率均化分解为δ=0.05的时间序列。在图6中,我们给出了每日时间序列的相同值。四、 图1中的讨论我们看到,虽然描述对数收益的时间序列高度不可预测,徘徊在最大熵1附近,但分解后的时间序列更可预测,事实上,对于δ的低值,这种可预测性更高。表I给出了各种δ值的平均香农熵。这是可取的,因为δ值较高时,偶数时间将低于0.05 0.20-0.13-0.140.0 0.2-0.17-0.180.0 0.4 0.8-0.170.5 1.5-0.170.05 0.200.99 0.97 0.96 0.95 0.930.99 0.98 0.960.05 0.250.940.0 0.20.99 0.97 0.950.990.0.30.980.0.40.80.990.5 1.50.05 0.25 0.0 0.30 0.60.0.6 VHδ=1 VHδ=0.75 VHδ=0.25 VHδ=0.25 VHδ=0.1 VHδ=0.05FIG。4.皮尔逊对每日日志收益率估计的香农熵率之间的相关性:原始二元时间序列、原始四元时间序列和波动率均化分解的二元时间序列,δ:0.05、0.1、0.25、0.5、0.75和1.1.21.4 1.6 1.82.00.05 0.10 0.15 0.20 0.25熵率(日志收益[4])熵率(VHδ=0.05)图5。

16
何人来此 在职认证  发表于 2022-5-6 09:36:25
基于原始四元时间序列和波动率均化分解时间序列(δ=0.05)估计的日内对数收益香农熵率散点图。在真实的市场时代相距甚远,因此这类时间序列在实际用途上就不那么有趣了。这也是我们所期望的,因为对于δ的较小值,价格变化的数量将比δ大得多,这将构成分解数据中同一方向的几个δ大小的移动模式,即模式本身。换句话说,预测大的价格变动比预测小的价格变动更难。因此,我们倾向于说,波动率均一化分解确实使时间序列的噪音大大降低,从而使我们得到了带有模式的数据,原则上,这些模式可以用于预测。从参考文献[1]中提到的结果来看,这可能并不总是一项容易的任务,这一点已被研究可预测性和1之间关系的研究所证实。4 1.5 1.6 1.7 1.8 1.9 2.00.0 0.1 0.2 0.3 0.4熵率(日志返回[4])熵率(VHδ=0.05)图6。基于原始四元时间序列和δ=0.05的波动率均化分解时间序列估计的日常日志收益香农熵率散点图。可行性[6],但原则上是可能的。在图2中,我们可以看到华沙市场的日常股票回报率呈现出类似的模式。然而,这次分解时间序列的结果要少得多,这是可以理解的,因为这种方法是为处理高频数据而设计的。对于δ的低值,该方法似乎也可以用于每日收益,尽管这种方法的有用性是一个悬而未决的问题。表一。

17
可人4 在职认证  发表于 2022-5-6 09:36:27
所有研究时间序列的平均Shannon熵率,参数Δδ′Hctw0的不同值。05 0.130.10 0.170.25 0.230.50 0.270.75 0.301.00 0.32在图3中,我们看到,用各种δ值估算的成分熵率高度相关,这使我们相信,波动率同质化并不敏感地依赖于该参数的选择。这一点很重要,因为在实际应用中,该参数的选择并不源于任何理论,而且在很大程度上取决于分析人员的直觉,以及在给定价格变化粒度下的特殊兴趣。在图4中,我们可以看到类似的结果出现在日常收益中,事实上,这里的相关性更大,从0.93到0.99不等,而对于δ等于0.05和1的分解时间序列,香农熵的相关系数估计为0.77。因此,原则上,分析人员可以从他们的角度选择他们感兴趣的δ的任何值,并使用这种方法获得良好的结果。使用的预测模型对这些微小变化的敏感性可能存在于某些方法中,但这个问题超出了本文的范围。在这些图上,特别有趣的是,原始时间序列的熵越小,分解的时间序列的熵就越大,反之亦然。这可能很有帮助,因为模式很少的时间序列可以转换为模式很多的时间序列。为了找出存在这种相关系数的原因,我们在图中绘制了原始时间序列离散为四分位数时估计的香农熵率与分解时间序列之间的关系,其中δ=0.05表示日内和日内回程。分别为5和6。

18
kedemingshi 在职认证  发表于 2022-5-6 09:36:31
我们可以看到,这似乎主要是由分解时间序列的香农熵率的更大标准差造成的。最初的时间序列似乎在不可预测性方面更加连贯。看起来,虽然原始时间序列的可预测性主要取决于数据中的噪声(即它们几乎完全不可预测),但分解时间序列的可预测性更多地取决于收益的基本结构,而不是噪声,对于原始对数收益中噪声最大的股票,使原始时间序列和分解时间序列之间的可预测性发生更大的变化,同时使分解时间序列的可预测性在股票中变化更大。最后,我们还将注意到,我们在2013年10月21日至2013年11月8日之间的15天内,对描述纽约100只股票的时间序列进行了相同的研究,时间尺度为10年前的每日时间尺度,时间尺度为一分钟。这些时间序列更短,股票数量也更小。这使得结果缺乏说服力和稳定性,因此这些结果未被报道,尤其是因为它们与我们报道的结果一致。事实上,在上述所有考虑因素中,结果几乎与第一近似值相同。因此,我们假设这些结果并不特定于华沙市场,而是与所有金融市场无关。V.结论在这项研究中,我们已经证明波动率均匀化分解确实极大地提高了描述股票收益的时间序列的可预测性。

19
可人4 在职认证  发表于 2022-5-6 09:36:34
对于已设计方法的日内数据,选择空间中所研究规则点的宽度只会略微改变结果,因此我们还表明,波动率均匀化对该参数的选择也非常稳健。相关分析进一步证实了这一点。此外,原始股票收益率越不可预测,波动率均一化分解的可预测性就越高,这可能意味着原始对数收益率时间序列中的噪声可以通过这种方法很好地消除。我们的分析是在华沙证券交易所的一个非常大的日内和每日股票回报数据库上进行的。基于我们之前的研究以及本研究对NYSE100数据的有限复制,我们假设这些数据也应该对其他市场具有代表性。尽管如此,进一步的研究可能会尝试在纽约证券交易所和其他欧洲市场复制这些结果。然后,进一步的研究应尝试将这种分解应用于不同的时间序列,以将其与不同的预测方法进行比较,因为如[6]所示,可预测性和可预测性之间的关系尚未完全理解。还应进行进一步研究,以评估时间序列分解在其他可能有益的领域的有用性。[1] A.W.科瓦列夫斯基、O.D.琼斯和K。Ramamohanarao,《2014年IEEE金融工程与经济计算智能会议录》,A.Serguieva,D.Maringer,V.Palade,andR。J.Almeida(IEEE,伦敦,2014)第182-189页。[2] J.加兰,R。詹姆斯和E.布拉德利,ArXiV 1404.6823(2014)。[3] Y.Pesin,《俄罗斯数学研究》第32、55页(1977年)。[4] K.E。

20
何人来此 在职认证  发表于 2022-5-6 09:36:39
彼得森,遍历理论,剑桥研究高级数学(剑桥大学出版社,剑桥,1989)。[5] P.Fiedor,ArXiV 1310.5540v1(2013年)。[6] P.Fiedor,《2014年IEEE金融工程与经济计算智能会议录》,A.Serguieva,D.Maringer,V.Palade,andR.编辑。J.Almeida(IEEE,伦敦,2014)第247-254页。[7] F.Delbaen和W.Schachermayer,Mathematische Annalen 312215(1998)。[8] K.丹比斯,特奥。维罗亚特诺斯特。我是普里曼。10, 438(1965).[9] L.E.Dubins和G.Schwarz,美国国家科学院院长,53913(1965)。[10] B.Mandelbrot和H.Taylor,运营研究151057(1967)。[11] D.Madan和E.Seneta,《商业杂志》63511(1990)。[12] C.海德,《应用概率杂志》361234(1999)。[13] C.E.香农,贝尔系统。《技术期刊》27379(1948)。[14] A.Maciejewski,M.Latka和W.Jernajczyk,医学博士。戴德。威奇。四十、 90(2008年)。[15] Y.Gao,I.Kontoyiannis和E.Bienenstock,在IEEEInternational Symposium on Information Theory(2006)第645-649页上发表。[16] M.Farah、M.Noordewier、S.Savari、L.Shepp、A.Wyner和J.Ziv,《1995年苏打:第六届亚洲计算机学会暹罗离散算法研讨会论文集》(工业和应用数学学会,1995年),第48-57页。[17] I.Kontoyiannis,P.Algoet,Y.Suhov和A.Wyner,IEEE T.Inform。理论441319(1998)。[18] A.Lempel和J.Ziv,IEEE T.通知。理论IT-23337(1977)。[19] F.Willems,Y.Shtarkov和T.Tjalkens,IEEE T.Inform。理论41653(1995)。[20] M.Kennel、J.Shlens、H.Ababanel和E.Chichilnisky,神经计算机。17, 1531 (2005).[21]G.Louchard和W.Szpankowski,IEEE T.Inform。理论43,2(1997)。[22]F.Leonardi,《巴西概率统计杂志》24321(2010)。[23]T.Cover和J.Thomas,《信息论的要素》(John Wiley&Sons,1991)。[24]F.Willems,Y。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 10:12