楼主: 能者818
1333 30

[量化金融] 基于有序二元选择的动态收益分布预测 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-2 15:57:54
,k.估计了在阈值处评估的条件回报分布后,可以通过使用保持结果单调性的插值模式来获得整个(连续)条件分布。为此,我们采用Fritsch–Carlson单调三次插值(Fritsch和Carlson,1980)(见附录A.1和A.2),并使用结果测试估计分布的质量(见附录A.3和A.4)。有序模型中构造的条件分布的逼近质量由许多因素决定,其中插值精度最为重要。阈值数量(以及插值输入的精度)与参数化程度以及估计噪声量之间存在着重要的权衡。另一个因素是αj上斜率δ规格的灵活性。设置足够精确的阈值系统(只要一个不接近可计算性极限)来精确描述分布似乎是合理的。在我们的经验说明中,我们将每个差异限定为ε=10-6用力。在样本内估计期间,这种策略导致的所有差异之间的干扰仅不到1%,而在样本外预测期间,这种干扰不到2%。可以使用包DistributionalForecasts进行估计。作者在Julia软件中开发的jl。该软件包可在以下网址获得:https://github.com/barunik/DistributionalForecasts.jlbut不要太细,以便在相邻阈值之间有足够数量的观测值。对于较大的样本量,也可以提供更高的斜率灵活性;然而,在实践中,在半参数设置中,很少的数字通常是足够的。

12
可人4 在职认证  发表于 2022-6-2 15:57:57
还可以使用形式化模型选择标准,如Bayesianinformation标准,来选择斜率规格中多项式的最佳阶数。3数据和经验规范我们研究了在纽约证券交易所交易的29只美国股票的条件分布预测。这些股票是根据市值和流动性选择的。调查样本范围为2004年8月19日至2015年12月31日。我们考虑美国营业时间(东部时间9:30–16:00)内执行的交易。为了确保充足的流动性并消除可能的偏差,我们明确排除周末和银行节假日(圣诞节、元旦、感恩节、独立日)。总的来说,我们的最终数据集包括2826个交易日,其中500个交易日用于样本内估计,其余2326个交易日用于使用窗口大小为500天的滚动窗口方案进行样本外预测。我们将样本分割成一个更大的样本外部分,然后执行一系列广泛的测试、稳健性检查和模型间比较。接下来,我们将详细介绍我们的经验规格。对于有序和无序模型,我们使用logit链接函数∧(u)=exp(u)1+exp(u),从而得到logit规范。我们考虑将返回空间从α划分为37个相等空间的概率水平∈ (5%,95%),即步骤为2.5%的网格,导致p=37个总分位数。我们使用随滚动窗口变化的时变分区。在每个窗口中,cj计算为γ(αj)pσt,其中γ(αj)是亚马逊standardApple Inc.(AAPL)的分位数。com,Inc.(AMZN)、美国银行(BAC)、Comcast Corporation(CMCSA)、Cisco Systems,Inc.(CSCO)、Chevron Corporation(CVX)、Citigroup Inc.(C)、Walt DisneyCo(DIS)、General Electric Company(GE)、Home Depot股份有限公司。

13
可人4 在职认证  发表于 2022-6-2 15:58:01
(HD)、国际商用机器公司(IBM)、英特尔公司(INTC)、强生公司(JNJ)、摩根大通公司(JPM)、可口可乐公司(KO)、麦当劳公司(MCD)、默克公司(MRK)、微软公司(MSFT)、甲骨文公司(ORCL)、百事公司(PEP)、菲泽公司(PFE)、宝洁公司(PG)、高通公司(QCOM)、斯伦贝谢有限公司。(SLB)、美国电话电报公司(T)、威瑞森通信公司(VZ)、富国银行(WFC)、沃尔玛百货公司(WMT)、埃克森美孚公司(XOM)。使用更极端的概率水平值,如1%和99%,在500个观测值的样本窗口中,会导致尾部出现较大的估计不确定性,但当模型在整个样本上进行估计时,结果是成功的。我们还使用了p=19和p=73等间距概率水平的分区;有关详细信息,请参见第4.4小节。正态分布,σ是相应窗口中回报的条件方差,根据摩根大通标准的风险指标计算,作为指数加权移动平均值,衰减因子为0.94。我们选择k=2,预测值为xt-1,j=I{rt-1.≤cj}ln(1+| rt-1|)对于所有j=1,p、 第一个预测因子是与概率水平αj相对应的滞后指标,在所有此类指标中,该指标似乎具有最高的预测能力。第二个预测因子是波动率度量的代理,绝对回报率通过对数变换来抑制。请注意,第一个预测值是特定分位数的特定值,而第二个预测值是所有分位数的通用值。原则上,可以指定所有预测值在各个分位数上相同,或者相反,所有预测值可能随分位数变化。

14
kedemingshi 在职认证  发表于 2022-6-2 15:58:04
在有序模型中,我们在对高阶多项式的统计意义进行一些实验后,设定q=2和q=3。也就是说,对于过去指标,多项式的概率水平α为二次方,对于过去波动率代理,多项式的概率水平α为三次方。j=1,…,模型的完整规格,p经验分位数isPr{rt≤ cj | It-1} =exp(θt,j)1+exp(θt,j),θt,j=δ0,j+δ(αj)I{rt-1.≤cj}+δ(αj)ln(1+| rt-1 |),系数函数δ(αj)=κ0,1+2(αj- 0.5)·κ1,1+2(αj- 0.5)·κ2,1,δ(αj)=κ0,2+2(αj- 0.5)·κ1,2+2(αj- 0.5)·κ2,2+2(αj- 0.5)· κ3,2.总共有KO=44个参数:p=37个单独的截距δ0,jand k=2个斜率δ(αj),一个通过1+q=3个参数进行参数化,另一个通过1+q=4个参数进行参数化。这种参数化非常节省,并且非常接近分布,而附加项不会带来显著的改进。因此,除了单个截距之外,估计七个参数κi足以近似条件返回分布。4经验发现我们现在给出了使用有序二元选择模型估计回报的条件分布函数的结果。我们考虑对29只股票的预测,因此首先我们还使用有序模型中的贝叶斯信息准则进行模型选择分析;有关详细信息,请参见第4.4小节。给出三只说明性股票的个别估计值,即英特尔公司(INTC)、高通公司(QCOM)和埃克森美孚公司(XOM),然后我们以汇总形式给出所有29只股票的结果。在给出参数估计后,我们评估了预测分布的统计意义和经济意义。此外,我们将有序模型的性能与文献中使用的流行且具有挑战性的基准进行了比较。

15
mingdashike22 在职认证  发表于 2022-6-2 15:58:07
也就是说,我们包括两个表现最好的候选模型(Kuester et al.,2006)——一个具有偏态t分布的非对称广义自回归条件异方差模型(GARCHhenceforth)和GARCH过滤历史模拟(FHS)。在实施这两种替代方法时,我们遵循Kuester et al.(2006)。4.1参数estimatesTable 1显示了三种说明性股票的特定截距δ0的估计值,即有序logit模型。由于∧(·)单调递增且预测值的可预测性较低,截距具有预期符号-概率水平为负,左侧为50%,右侧为正,并表现出从左尾到右尾递增的预期单调行为,从而生成一个递增的累积分布函数(假设预测值为零)。在大多数情况下,截距具有统计意义,但中位数附近的几个切点除外。三种股票的截距值非常相似,但存在一些变化。图2所示的左图收集了所有29只股票的截距估计值,并揭示了所有股票的截距确实相似。该图的形状类似于先前定义的反向logit链接函数∧(u),尾部的影响更强。灵活的j-特定截距允许控制单个分位数效应,并表明无条件期望是预测分布的重要组成部分。表2显示了七个系数κi的估计值,即三个说明性股票预测值的斜率。系数κi,1与滞后指标预测因子i{rt相对应-1.≤cj}。滞后指标的所有参数估计值都很小,有些在统计上非常重要。

16
kedemingshi 在职认证  发表于 2022-6-2 15:58:10
图1中的左图用方框图和胡须图所示的所有29只股票的滞后指标系数估计值来完成这些发现。这些估计记录了滞后指标对不同股票未来概率的不同影响。虽然我们记录了一些股票的零系数,但二次项似乎在其他股票中起着重要作用。第二个预测因子,过去的波动率代理ln(1+| rt-1 |),携带关于未来概率的更重要信息。与波动率预测值相对应的估计系数κi,2表明三次多项式具有许多具有统计意义的系数(见表2)。图1的右图显示了所有29种股票的估计系数,如框须图。我们可以看到,对于大多数股票,κ1,2和κ3,2与零有显著差异,因此过去的波动率代理对收益分布的预测有很大贡献。图2绘制了除截距外的函数δ(αj)和δ(αj)。对应于异质参数κi,1,29只股票的函数δ(αj)也是异质的,表现出滞后指标预测因子的混合效应(如图2的中间图所示)。总的来说,我们可以看到影响很小。过去的波动率代理所隐含的系数函数δ(αj)也显示出类似的影响。图3描述了区间收益率的插值预测条件CDF[-1.5,1.5]对于在任意100个样本期外评估的任意库存。我们可以观察累积分布是如何随时间变化的。存在一定的分布集群,即CDF具有一定的持久性,而在某些时期CDF的形状从集群中延伸出来。4.2统计拟合为了评估预测分布的充分性,我们对Gonz'alez Rivera和Sun(2015)进行了广义自动分类测试。

17
mingdashike22 在职认证  发表于 2022-6-2 15:58:13
该测试验证样本外广义残差(也称为概率积分变换)及其滞后是否均匀分散在相应维度的超立方体中;详细说明见附录A.3。我们在等高线聚合测试中使用滞后L=1,简单的边集合α=(0.25,0.50,0.75),更大的集合与我们的完整网格α=(α,α,…,αp)一致。在L=3和L=10的滞后聚合测试中,我们使用侧‘α=0.5。图4显示了Gonz'alez Riveraaand Sun(2015)对所有29只股票的有序logit模型测试得出的p值分布。测试的所有四个变量——两个等高线聚合和两个滞后聚合——显示了估计条件分布的充分性。我们还根据适当的评分规则比较了不同模型的概率预测(Gneiting和Raftery,2007),即Brier评分和连续排名概率评分(CRPS);详细说明见附录A.4。图5显示了四个模型(有序logit、单独logit集合、GARCH和FHS)的平均得分值。所有四种方法都提供了具有相似中值的Brier分数,尽管在离散度上有所不同。所有四种方法的CRPS得分都非常相似,但逻辑模型略占主导地位。该股票在整个样本中的最小和最大回报值约为-0.20和0.20。我们在构建测试时没有考虑估计噪声。

18
mingdashike22 在职认证  发表于 2022-6-2 15:58:16
因为它通常倾向于增加渐近方差,如果考虑估计噪声,p值将更高。我们遵循Gneiting和Raftery(2007)的规定,用减号定义CRP,以便其较大值优先于较小值。4.3经济意义为了理解拟议模型的经济有用性,我们研究了基于模型预测的市场时机选择的简单规则。我们的想法是从整个发行版中探索信息。为了构建交易策略,我们探讨了预测的条件概率和无条件概率之间的差异,这表明是否以更高的概率预测正或负回报。本着之前文献的精神(Breen等人,1989年;Pesaran和Timmermann,1995年;Anatolyev和Gospodinov,2010年),我们根据持有股票和投资无风险资产之间的主动投资组合分配交易策略的收益来评估模型预测。交易策略的详细结构见附录A.5。表3总结了在平均和中值回报、波动率以及夏普比率方面运行交易策略的结果。虽然基准市场策略的回报率为0.806,波动率为0.244,但GARCH和FHS的回报率相似,波动率较低。当投资者使用单独的logit模型对整个分布进行预测时,平均收益率为1.088,而可用性要低得多。最后,我们提出的有序logit模型的平均回报率为1.296,其偏好性与单独logit模型相似。夏普比率显示了风险调整后的回报,或每单位波动率的平均回报,表明当考虑风险时,有序logit模型产生的回报最高。

19
大多数88 在职认证  发表于 2022-6-2 15:58:20
中值的图表证实了这一结果。图6显示了所有29支股票的回报率、波动率和夏普比率,使用了方块图和晶须图。图中显示,天真的买入并持有策略产生的回报率较低,波动率最高,而且对于所有考虑过的股票来说,回报率也相当不均匀。GARCH和FHS改进了波动率估计,因此产生了类似的回报,风险更低。就风险调整后的夏普比率而言,单独的logistic回归得出了类似的结果,而有序logit模型则有显著的改进。几乎所有考虑过的股票都可以看到夏普比率为正,表明有序模型所带来的风险调整后回报率最高。图7仔细查看了我们之前使用的三种插图股票的累积收益和提取。可以看出,有序logit策略的回报随着时间的推移是一致的,下降幅度最小。即使在XOM整个时期都在增长的情况下,这一点仍然成立,因此很难击败买入并持有策略。最后,我们比较了图8中所有五种策略的相对性能。图中左上角的图将ordered logit与“market”或naive buy and holdstrategy进行比较,而右上角的图将ordered logit与单独的logit进行比较。图8底部的图比较了有序logit与GARCH和FHS。与所有29只股票的无序logit和基准策略相比,我们证明了所提出的有序logit模型始终表现更好。4.4敏感性分析如前所述,经过一些实验,我们选择了p=37阈值和多项式阶数q=2和q=3的规格。在这里,我们报告了不同规格的结果。

20
nandehutu2022 在职认证  发表于 2022-6-2 15:58:23
作为稳健性检查,我们研究了分段性和多项式复杂性对所提方法性能的影响。我们使用不同的分区选择对模型进行了估计和评估,命名为p=19(对应于两倍粗的分区)和p=73(对应于两倍细的分区)。一方面,对于CDF近似值而言,p=19似乎过于粗糙,不能被认为是好的。另一方面,过高的p可能会严重影响模型的复杂性:虽然基本分区的参数数量p=37等于KO=44,但对于内分区,它等于80,这对于我们的样本外练习(500个滚动样本观测值)来说显然太多了。在我们对p=19和p=73的实验中,一些广义自同构检验(尤其是三边轮廓聚合检验)显示出拒绝构建的条件分布的趋势。虽然经济评估的结果对分区的选择不敏感,但基于有序logit的方法仍然优于所有其他方法。一方面,多项式阶数(q,q)不会对节俭程度产生显著影响,另一方面,可预测性对概率水平的依赖性可能不太复杂,不需要高阶幂。因此,人们对订单的选择不太敏感。我们在运行(q,q)=(2,3)组合周围运行了多项式阶数(q,q)的各种组合,并计算了每个组合的贝叶斯信息准则(BIC)值。BIC的模式如图9所示。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 08:35