楼主: 何人来此
1753 35

[量化金融] 基于递推的短期极端收益预测 [推广有奖]

11
可人4 在职认证  发表于 2022-5-26 20:33:43
此外,Yan和van Tuyll van Serooskerken(2015)使用可见图算法将价格序列转换为网络,并使用价格网络的程度来衡量股票价格指数级以上增长的幅度,预测即将发生的金融极端事件。平均而言,该指示器的性能优于LPPLS模式识别指示器。对金融危机的模式进行建模,以预测金融极端事件。Jiang等人(2016年)揭示了连续市场极端之间等待时间的分布模式,并利用它来确定在特定时间段内出现后续极端的风险概率。他们发现,这种危险概率在样本预测之外表现良好。作为地震周围地震活动的类似物,Gresnigt et al.(2015)采用流行病型余震序列模型(一种相互自激的Hawkes点过程)来捕捉股市崩盘的发生动态,可以作为预测中期崩盘概率的预警模型。3、数据集我们分析了1885年2月16日至2015年12月31日的每日道琼斯工业平均指数(DJIA)。道琼斯工业平均指数在一天的时间尺度上的对数回报率为r(t)=ln I(t)- ln I(t- 1) 。(1) 图1(a)和图1(b)分别显示了对数DJIA及其收益率的曲线图。道琼斯工业平均指数从1885年2月16日的30.92增长至2015年12月31日的17425.03,总对数回报率大于6。尽管该指数在整个样本期内呈上升趋势,但在不同的时段内都有下降趋势和范围界限。

12
kedemingshi 在职认证  发表于 2022-5-26 20:33:46
图1显示了六个动荡时期(阴影中突出显示),1929-1932年的华尔街崩盘,1973-1975年的石油危机,1987-1989年的黑色星期一崩盘,2000-2003年的网络泡沫,2007-2009年的次贷危机,2008年的金融危机,以及2011-2015年的欧洲主权债务危机。模型和方法4.1。识别极值通常将极值定义为阈值(POT)以上的峰值(Ren和Zhou,2010b;Alessi和Detken,2011;Christensen和Li,2014;Sevim等人,2014;Suo等人,2015),即样本标准偏差的m倍。参数m是一个预先确定的值(见Sevim et al.(2014)表1中的总结)。虽然根据POT识别极端事件在实证分析中得到了广泛应用,但POT存在缺陷。一个小的m值将产生许多“极值”,并非所有的都是真正的极值,而一个大的m值将表示真正的极值,但不一定包括所有的极值。根据极值理论,极值的分布不同于非极值的分布。找到极值相当于找到一组数据(x≥ xt)满足极值分布1885 1911 1937 1963 1989 201546810tln I(t)(a)1885 1911 1937 1963 1989 2015-0.2-0.100.10.2tr(t)(b)图1:(在线彩色)。对数DJIA指数ln I(t)及其差异的曲线图,返回r(t)。(a) ln I(t)。(b) r(t)。(Cumperayot和Kouwenberg,2013)G(x)=exph公司-(1+γx-uσ)-1/γiforγ,0exph- 经验值(-x个-uσ)iforγ=0,(2),其中G(x)是广义极值分布的累积分布,u、σ和γ分别是位置、尺度和形状参数,Xt是极值阈值。

13
nandehutu2022 在职认证  发表于 2022-5-26 20:33:50
形状参数1/γ的倒数只是样本分布的尾部指数。10-610-410-21000246-r、 r,| r | 1/γ(a)-rr | r | 10-610-410-210000.20.40.6-r、 r,| r | dKS(b)-rr | r |图2:(在线颜色)。确定负、正和绝对回报的极值阈值XT。(a) 尾部指数1/γ与排序收益的函数关系图。(b) KS统计数据与排序收益的关系图。KS统计数据定义为经验尾部分布和拟合尾部分布之间的最大绝对差异。我们使用Hill估计器(Hill,1975)估计形状参数γ,这是一种非参数方法。对于agiven样本{x,x,···,xn},我们按照升序x(1)对数据进行排序≤ x(2)≤ · · · ≤ x(n)。(3) Hill估计量给出的γ值为γ=kkXi=1对数x(n+1-k)- 对数x(k), (4) 其中xk对应于将要确定的极值阈值xts。确定阈值XTI的一种方法是:(i)根据xt的所有可能值估计γ值,以及(ii)根据xt绘制1/γ图,以找到一个xt值范围,其中估计的1/γ值是稳定的(Pozo和Amuedo Dorantes,2003;Rebredo等人,2014)。实际上,1/γ和xkis之间的这种“稳定行为”很难量化。例如,图2(a)使用DJIA回报来说明估计的1/γ作为排序的DJIA(负、正和绝对)回报的函数。1/γ值强烈波动,没有稳定范围。另一种方法是使用KS统计来衡量经验尾部分布和拟合尾部分布之间的一致性。KS统计量化两种分布之间的最大绝对差异。

14
能者818 在职认证  发表于 2022-5-26 20:33:53
最合适的阈值XT与尾部分布的最佳匹配相关,尾部分布的KS统计值最小(Clauset al.,2009;Jiang et al.,2013)。图2(b)显示了KS统计数据与排序(负、正和绝对)回报的关系图。每条曲线中的显著低点使我们能够更容易地确定极值阈值xt。为了进行比较,我们还使用95%、97.5%和99%的分位数来定义极值。基于分位数的定义在风险价值(VaR)分析中很常见。Gresnigt等人(2015年)还将95%的收益分位数和95%的负收益分位数定义为极端和崩溃。4.2。确定风险概率通过仅考虑极端发生的时间,我们根据风险概率W预测极端回报(t | t),它测量了在过去的t时间发生极端返回后,有额外等待时间的概率在另一次极端回归发生之前。Sornette和Knopo Off(1997)以及Bogachev等人(2007)从理论上推导出了危险概率W(t、 t)使用极端事件之间的复发间隔分布,W(t | t)=Rt+ttp(τ)dτR∞tp(τ)dτ,(5),其中p(τ)是重复间隔的概率分布。一旦我们得到p(τ)的分布形式,W的公式(t | t)可从等式。

15
nandehutu2022 在职认证  发表于 2022-5-26 20:33:57
(5) 。虽然泊松过程的复发间隔呈指数分布(Yamasaki et al.,2005;Bogachev et al.,2007;Chicheportiche and Chakraborti,2014),但当如果给定t,金融过程总是表现出非泊松特征,如长期依赖性和多重分形相关性(Calvet和Fisher,2002),中期依赖性(例如动量和反转行为(Chan et al.,1996;Shi et al.,2015)),以及收益的多尺度行为(Calvet和Fisher,2002),这导致重现期不再呈指数分布,重现期的紧密分布形式的推导受阻(Chicheportiche和Chakraborti,2013)。非泊松特征也导致了在重复间隔分布公式的实证分析中存在争议的情况。例如,报告的分布范围从幂律分布(Yamasaki et al.,2005;Lee et al.,2006;Greco et al.,2008;Ren and Zhou,2010a)到拉伸指数分布(Wang and Wang,2012;Suo et al.,2015;Jiang et al.,2016),从q指数分布(Ludescher et al.,2011;Ludescher and Bunde,2014;Chicheportiche and Chakraborti,2014)到q-Weibull分布(Rebredo et al.,2014)。在这里,我们使用三个常用函数来拟合递推区间分布。这三个公式是拉伸指数分布,p(τ)=a exp-(bτ)u, (6) q指数分布,p(τ)=(2- q) λ[1+(q- 1) λτ]-q-1,(7)和威布尔分布,p(τ)=αβτβ!α-1exp“-τβ!α#,(8)通过将三个概率分布方程。(6) –(8)转化为等式。

16
能者818 在职认证  发表于 2022-5-26 20:34:01
(5) ,我们得到了拉伸指数分布的危险概率WsE(t | t)=bua- Γlu,(bt)u- Γuu,[b(t+t) ]uΓuu,(bt)u , (9) 危险概率WqE(t | t)对于q指数分布,WqE(t | t)=1-“1+(q- 1) λt1+(q- 1) λt#1-q-1、(10)和危险概率WW(t | t)对于威布尔分布,WW(t | t)=1- exp“tβ!α-t+tβ!α#,(11),其中Γl(s,x)和Γu(s,x)是上下不完全伽马函数。对于固定t、 所有三种风险概率都随着t的增加而降低,这解释了财务回报和波动性中极端的聚集。使用危险概率W(t | t)为了预测极端情况,我们必须设置一个危险阈值,以触发即将到来的极端事件的早期警告指示器。如果危险概率W(t | t)大于危险阈值wt,表示在下一个t时间被激活。风险阈值WT不是任意给定值,而是根据投资者的风险水平偏好进行优化,以平衡错误警报和未检测事件。4.3。评估预测信号危险概率W(当W(t | t)超过危险阈值WT,否则等于零。当将预测的极端情况与实际事件进行比较时,我们看到(i)发生极端回报的正确预测,(ii)发生非极端回报的正确预测,(iii)错过的事件,以及(iv)假警报。通过计算每个结果发生的次数,我们可以计算一系列评估测量值,包括正确的预测率、误报率和准确性。

17
可人4 在职认证  发表于 2022-5-26 20:34:06
我们这里的首要目标是正确预测率D和误报率A,它们定义为D=nn+n,A=nn+n,(12)其中nis是正确预测的极端回报数,正确预测的非极端回报数,错过事件数和误报数。继Gresnigt等人(2015年)之后,我们使用Hanssen-Kuiper技能评分(KSS)来评估极端预测的有效性。KSS是区别- A正确预测率和虚警率之间的值。KSS包含丢失发生错误和假警报错误。减少这两个错误会增加KSS的值。我们的目标是,当投资者偏好类型1和类型2错误时,为他们找到一个平衡的信号,并考虑他们是否使用或放弃预测信号。继Alessi和Detken(2011)之后,我们定义了当添加危险概率阈值时的损失函数发布极端预测,L(θ)=θ(1- D) +(1- θ) A,(13)其中1- D是缺失事件(1类错误)的比率,A是假警报(2类错误)的比率。参数θ是投资者避免1类或2类错误的偏好(El Shagi等人,2013)。我们进一步确定了极端预测asU(θ)=min(θ,1)的有用性- θ)- L(θ),(14),其中min(θ,1- θ) 是投资者忽视预测信号时所面临的损失,而U(θ)是极端预测模型比没有模型表现更好的延伸(Betz et al.,2014)。当U(θ)>0时,极值预测很有用,这意味着使用预测的损失低于忽略预测时的损失。

18
mingdashike22 在职认证  发表于 2022-5-26 20:34:10
此处的有用性定义忽略了数据不平衡的任何影响,即非极端事件比极端事件更频繁(Sarlin,2013;Betz et al.,2014)。给定危险概率W(t | t),我们需要一个最大化效用U(θ)的危险阈值(Duca和Peltonen,2013;Babeck\'y等人,2014;Betz等人,2014)。Christensen和Li(2014)通过最小化噪声信号比D/A来优化阈值。当我们优化有用性时,类型1和类型2错误之间存在边际替代率,但该边际替代率在噪声信号比优化中并不明确,这可能会导致不可接受的1型和2型错误水平(Alessi和Detken,2011;El Shagi等人,2013;Babeck\'y等人,2014)。4.4。通过在概率密度函数中引入等式(6)的拉伸指数函数来估计分布参数+∞p(τ)dτ=1,weobtainaubΓ(u)=1,(15),其中Γ(x)是伽马函数。Podobnik et al.(2009)和Bogachev and Bunde(2009)描述了平均复发间隔τQ和极端百分比τQ=R之间的一一对应关系+∞mpr(r)dr=1-Rm-∞pr(r)dr=1- Q、 (16)其中Q是用于确定极值的分位数。为了使这个方程有效,极值必须是正的。当极端值为负值时,我们将其乘以-Chicheportiche和Chakraborti(2014)发现,无论基础过程的依赖结构如何,平均复发间隔都是普遍的。根据预期的定义,平均重现期也可以写成τQ=R+∞τp(τ)dτ。对于拉伸指数分布,通过求解方程,我们得到了ubΓ(u)=τQ.(17)。(15) 和(17),并使用u和τqf作为拉伸指数分布,参数a和barea=uΓ(2/u)Γ(1/u)τQ,b=u(2/u)Γ(1/u)τQ。

19
mingdashike22 在职认证  发表于 2022-5-26 20:34:13
(18) 该策略将估计参数的数量从三个减少到一个。q指数分布的平均值为1/[λ(3- 2q)]。要有一个平均值,q必须小于3/2。然后可以使用q和τq求出参数λ,λ=τq(3- 第2季度)。(19) 威布尔分布的期望值为βΓ(1+1/α)。同样,β可以用α和τQ表示,β=τQΓ(1+α)。(20) 当三种分布用于拟合重现期时,我们只需要估计一个参数。我们采用最大似然估计(MLE)来估计分布参数。对数似然函数是拉伸指数分布n LsE=n lna-nXi=1(bτi)u,(21)q指数分布n LqE=n ln[λ(2- q) ]-q- 1nXi=1ln[1+(q- 1) λτi],(22)和Weibull分布LW=n lnαβ+nXi=1“(α- 1) lnτiβ-τiβ!α#,(23),其中n是重复间隔数。以拉伸指数分布为例,对数似然函数ln lse是u的单变量函数。虽然通常我们可以通过取ln-lse对u的一阶导数来求解方程,以找到使可能性最大化的解,但这里很难获得ln-lse对u的导数的解析表达式。因此,我们在(0,1)范围内用10步离散u-6并计算u的每个离散值的对数似然函数。与ln lsels的最大值相关的u是最大似然估计。同样,我们估计参数q∈ (1,1.5)和α∈ (0,1)分别适用于Q指数分布和威布尔分布。5.

20
kedemingshi 在职认证  发表于 2022-5-26 20:34:17
递推区间分析为了检验我们的极端收益预测模型的有效性,我们使用每个动荡期之前的数据来校准模型以及随后的每个动荡期进行样本外预测。我们获得了六个样本内校准周期:1885-1928、1885-1972、1885-1986、1885-1999、1885-2006和1885-2010。它们的样本外预测周期分别为1929-1932、1973-1975、1987-1989、2000-2003、2007-2009和2011-2015。在每个样本校准周期,我们识别极值阈值xt,并提取与xt相关的极值。我们还根据95%、97.5%和99%的分位数阈值定位极值。对于每组极值,我们估计连续极值之间的等待时间,即重复间隔。我们在分析中考虑了正、负和绝对回报,因为它们可能与特定的交易策略有关。在市场上持有多头头寸的投资者对极端负面回报更为敏感,而持有空头头寸的投资者则不那么敏感。表1列出了不同校准周期的不同阈值的重复间隔。请注意,与分位数阈值的观测不同,极值阈值的观测值不会随着校准周期的延长而单调增加。重现期的数量急剧减少,例如从B组到C组的正收益和从C组到D组的绝对收益,表明极值阈值大幅增加,表明1973年后的市场变得更加不稳定[见图1(B)]。重现期的平均值受到极值的强烈影响,如平均值和中间值之间的巨大差距所示。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 22:29