楼主: kedemingshi
802 28

[量化金融] 基于稀疏卡尔曼滤波的高阶协方差估计方法 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-5-10 18:12:39 |只看作者 |坛友微信交流群
对Γ的后验分布进行估计,这比后验模型提供了更多的信息3。可以得到协方差估计中的不确定性估计。为了描述估计Γ的贝叶斯方法,让Φ表示未知参数Φ=YmissΦ=X(1∶T)Φ=J(2)∶T)Φ=DΦ={σo,i}1≤我≤NΦ=ζΦ=σj,i(t)i=1,。。。,N、 t=1,。。。,T(24),其中Ymiss是未观察到的价格。与前一节中的K ECM方法不同,我们对缺失的观测值Ymiss进行采样。采样Ymiss的一个优点是X(t)的协方差X(t)-1) ,X(t+1),Y(t),Ymiss(t)对所有的2都是一样的≤ T≤ T-1,式中为X(t)的协方差X(t)-1) ,X(t+1),Y(t)取决于t。这种简化允许在吉布斯采样器中进行更快的数值模拟。在给定数据Y(t)的贝叶斯方法中,我们希望计算Γp(γ)的后验分布y)=∫p(y)φ、 γ)p(φ,γ)dφ∫ ∫p(y)φ、 γ′)p(φ,γ′)dφdγ′。(25)一旦获得后验值,可通过E获得Γ的后验平均值yΓ=γp(γy) dγ。(26)后验平均值在最小均方误差(MMSE)意义下是最优的,可以用作Γ的估计值。计算(25)和(26)中的积分很难,但是我们可以使用马尔可夫链蒙特卡罗(MCMC)技术(如吉布斯抽样)从后验分布中获得样本。然后可以使用这些样本来获得E的估计值yΓ。估计E的Gibbs抽样方法yΓ将在下一节中介绍。4.1 Gibbs采样方法Gibbs采样[14]是一种MCMC方法,用于从p(φ,γ)等多变量分布生成样本y) 。在这种情况下,可按如下方式实施吉布斯采样,以生成Γ(1),p(γ)中的Γ(MG)y) .1。初始化第一个样本Φ(0),Γ(0)2。

使用道具

22
可人4 在职认证  发表于 2022-5-10 18:12:43 |只看作者 |坛友微信交流群
对于k=1到MGo样本Y(k)来自条件分布p(YmissX(k)-1) ,σo)o对于t=1到t,样品X(t)(k)来自p(X(t)y、 y(k)小姐,Φ(k)-1)2∶6,X(k)(1)∶T-1) ,X(k)-1) (t+1)∶T),Γ(k)-1) )o对于l=1到l–对于t=1到t,n=1到n* 样本Jn(t)(k)-1+1五十) fromp(jn(t)y、 Φ(k)0,1,J(k)-1+1五十) 一,∶N-1(t),J(k)-1+(l-1)五十) n+1∶N(t),Γ(k)-1) )op(D)中的样本Dy、 Φ(k)0∶2,Φ(k)-1)4∶6,Γ(k)-1) )o来自p(γ)的样品Γ(k)y、 Φ(k)0∶3,Φ(k)-1)4∶6) o样品σ2(k)的rom p(σo)y、 Φ(k)0∶3,Φ(k)-1)5∶6,Γ(k))o来自p(ζ)的样本ζ(k)y、 Φ(k)0∶4,Φ(k)-1) ,Γ(k))o来自p(σj,i(t)的样本σ2,(k)j,i(t)y、 Φ(k)0∶5,Γ(k))对于所有i,twhereΦi∶j参考[Φi,…,Φj],其中Φ-n(t)=[Φ(t),…,Φn-1(t),Φn+1(t),Φ(t)]从条件分布中提取的每个步骤都可以如附录D所示简单地实现。使用Mar-kov链上的众所周知的结果可以表明,上述Gibbs采样器产生的样本形成了一个马尔可夫链[37],具有极限平稳分布p(φ,γy) .4.2Γ的估计Γ(k)的样本用作Γ后验分布的估计。使用估计的后验分布,Γ的后验平均值是Γ(k)的样本平均值(我们丢弃了耳肝样本,以便样本收敛)^Γ=MG-k+1MGm=kΓ(m)。另一种估计Γ的技术是Rao Blackwellization,它减少了协方差估计中的方差[28]。在这里,我们从条件平均数的样本中得出一个后验概率的估计值,即Γ^Γ=MG-k+1MGm=kE(Γ)Φ(k))。下一节中介绍的数值实验使用Rao Blackwellization进行后验均值估计。5数值结果在本节中,我们评估了以下算法hms1的性能。肯姆[16]2。KECM L aplace(第3节)3。KECM道钉和板(第3节)4。MCMC方法(第4节)5。使用TSCV[19,44]6进行成对刷新。

使用道具

23
可人4 在职认证  发表于 2022-5-10 18:12:46 |只看作者 |坛友微信交流群
使用TSCV和跳跃校正进行成对刷新[10],用于从高频数据确定协方差矩阵。使用模拟高频返回数据的蒙特卡罗方法对性能进行评估。5.1绩效评估方法在本研究中,我们跟踪协方差估计的两个绩效指标。对于第一个性能指标,我们计算最小方差组合w=arg minwwT^Γws。Tiwi=1。然后,将该港口对账单回报的方差计算为价值图。投资组合回报的方差在~wTΓw下方给出。对于第二个性能度量,我们计算真实和估计的协方差之间误差的相对Frobenium∑i、 jΓi,j-^Γi,j∑i、 jΓi,j.5.2算法初始化和其他考虑在每次研究中,我们以相同的方式初始化算法。先验分布的超参数如表1所示。对于KEM和KECM算法,使用[5]中的时间刷新方法计算初始共变估计。每个算法的漂移和跳跃估计初始化设置为零。对于MCMC算法,我们将KECM spike and slab算法的输出作为第一个样本。在KECM算法中,我们使用了一个额外的初始化步骤,以避免陷入过度平滑的局部解中。这一步涉及使用前向卡尔曼滤波器,而不是更平滑的滤波器,在KECM算法的前10次迭代中近似X(t)的后向分布。经过10次迭代后,我们回到第3节中描述的使用卡尔曼平滑器的方法。协方差估计的稳定性构成了KECM算法中停止准则的基础。

使用道具

24
nandehutu2022 在职认证  发表于 2022-5-10 18:12:49 |只看作者 |坛友微信交流群
当当前和先前协方差估计值之间的相对差值小于0.001时,KECM算法在迭代n时终止∑i、 j^Γ(n)i,j-^Γ(n)-1) 我,j∑i、 j^Γ(n)-1) 我,j< 0.001.对于MCMC算法hm,我们生成了10000个样本,并丢弃了前2000个样本,以便马尔可夫链收敛。由于跳跃无法预测,如果在跳跃发生时没有观测到冰,就会出现模糊。因此,为了避免歧义,我们假设只有在观察到ITH价格的情况下,ITH资产价格才会出现跳跃。我们认为这是一个温和的假设,因为在许多市场中,有效价格的跳跃几乎会立即被交易。通过设置λ=∞未发生观测时ζ=1。5.3模拟数据跳跃模型在数据研究中,我们根据方程式(1)和(3)每隔1秒模拟20个资产的30分钟数据。这里生成了50个数据集来测试我们的算法。从美国的因素模型中获取动机。我们根据以下5个因子模型设置协方差=i=1βvivivTi+i。这里我们计算每个蒙特卡罗数据集的新协方差。我们用均值从多变量正态分布中得出√协方差为0.5I。对于i>1,我们从均值为零且协方差为i的多变量正态分布中得出Vi。因子va r ianceβVi被建模为形状为2且均值为0的伽马分布。7.*i=1时为0.02,平均值为0。3.4.*0.02I≠ 1.术语定义为0。0223400*100.通过这些设置,每个模拟资产的平均日回报波动率约为2%。对于D参数,我们对每个数据集使用一个随机数生成器。D的值来自多变量正态分布,平均值为0,协方差为0.01我

使用道具

25
可人4 在职认证  发表于 2022-5-10 18:12:52 |只看作者 |坛友微信交流群
每个资产的观测噪声方差设置为从形状为2且平均值为0.0002的伽马分布中提取的随机数。对于25美元的股票价格,这相当于约0.005美元的平均噪声标准差。跳跃参数ζ和σj在几个值上参数化变化。KECM和MCMC算法都需要为先验分布指定超参数。对于这些实验,我们选择超参数,这将导致不同的先验,以尽量减少偏见。对于KECM算法中拉普拉斯先验的超参数,我们使用了第2.5节中描述的技术。表1列出了算法中使用的所有超参数。任何给定价格被观测到的概率都与价格创新有关。这与经验观察一致,即交易量与波动率呈正相关[26]。为了模拟这种关联,在t时观察到mthasset价格的概率被模拟为aspobs,m(t)=Xm(t)-Xm-1(t)-DmXm(t)-Xm-1(t)-Dm+在哪里=2Γm,mπpObs-1..选择ν可确保当创新达到其平均绝对价值时,2Γm,mπ,观测的概率为pObs。我们在数值实验中设定pObs=0.3。数值注释αζ10×0.99 5βζ10-ζ的αζ先验平均值为0.995αjβj0。01(αj+1)σjis 1e-4αoβo(αo+1)的先验模式×0.0001σois 1e-8ηN+5Wo0的先验模式。02(η+N+1)i与使用第2.4节βλ5e-04中的方法获得的0.02%日波动率αλ5.6相关,使用第2.4节中的方法获得。表1:KEM、KECM和MCMC算法HM中使用的参数。跳跃参数不同值的性能结果见表2 a和表3。对于大多数情况,我们发现当存在跳跃时,Kecmaches方法的性能优于其他方法。

使用道具

26
mingdashike22 在职认证  发表于 2022-5-10 18:12:56 |只看作者 |坛友微信交流群
在图9中,我们展示了各种算法的真实价格的卡尔曼估计。该图突出了KEM算法在存在跳跃时的缺点,即它过度平滑了跳跃附近的价格。5.4 GARCH(1,1)-跳跃模型的模拟数据除了跳跃差异模型之外,我们还评估了多元GARCH(1,1)-跳跃定价模型[15,31,8]的算法,其中跳跃的影响持续存在于价格波动中。使用G ARCH(1,1)跳跃模型,对数价格数据生成为Xi(t)=Xi(t)-1)+hiVi(t)+Ji(t)Zi(t)+Dhi(t+1)=bihi(t)+ai(Xi(t)-Xi(t)-1)-D) +cihi(0)=Γi,i其中ai,bi,ci是非负的,bi+ai<1,ci=Γi,i(1-人工智能-bi)。这里v(t)被建模为具有oVi(t)的多变量正态分布~ 1)1 N)1 N)1 N)1 N/1 1 1 N/1 1 1 N/1 1 1 N/1 1 1 1 N/1 1 1.2e-10 1.3 e-10 10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 1.3 e-10 10 10 1.3 e-10 1.3 e-10 10 1.3 e-10 10 1.3 e-10 10 1.3 e-10 10 1.3 e-10 1.3 e-10 1 1 1.3 e-10 10 1 1.1.3 e-10 10 1 1.3 e-10 10 1.3 e-10 10 10 10 10 10 10 10 10 10 10 10 1 1.2.4e-10 2.3e-100.9995 0.00 01 3e-10 1.3e-10 1.2e-10 1.3e-10 7.9e-10 6e-100.9996.25e-06 2.4e-10 1.6e-10 1.6e-10 1.7e-10 4.7e-10 4.5e-100.999 2.5e-05 4.5e-10 1.7e-10 1.7e-10 1.8e-10 9.8e-10 6.9e-100.999 0.0001 8.2e-10 1.6e-10 1.7e-10 1.7e-10 1.7e-10 1.7e-09表2:跳跃模型的投资组合差异,最佳表现突出显示在绿色。2)vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv05 1.1 0.2 1 0.21 0.22 1.5 1.40.999 0.0001 4.8 0.20.2 0.21 4.6 3.6表3:跳跃模型的平均共变误差,最佳性能以绿色突出显示。

使用道具

27
能者818 在职认证  发表于 2022-5-10 18:12:59 |只看作者 |坛友微信交流群
大错误以红色突出显示。Seconds1340 1360 1380 1400 1420 1440 1460 1480 150070.270.470.670.871.271.471.6KEMKECM-LaplaceKECM-Spike and SlabMCMCObservationTruth图9:KEM、KECM和Gibbs采样的价格估算示例。这是价格小幅上涨附近smoot hing上的KEM算法的一个例子oEVi(t)Vj(t)=Γi,jΓi,iΓj,joEVi(t)Vj(t)=0表示t≠ t、 c的值确保在没有跳跃的情况下,ITH资产的长期平均波动率为Γi,i.我们还发现,任何两种资产之间的相关系数都是恒定的[8]。在这些实验中,ai=0.3,bi=0.5。这就考虑了波动性聚类,这在许多实证股票回报数据中都可以观察到。

使用道具

28
可人4 在职认证  发表于 2022-5-10 18:13:03 |只看作者 |坛友微信交流群
分配其他参数,如协方差矩阵,与前面的实验相同。GARCH(1,1)-跳跃模型的结果如表4-5所示。从这些表中我们可以看出,KECM和MCMC算法it hms对GARCH模型中显示的波动率聚类具有鲁棒性。2.3.e-10 1.3e-10 10 1.3 e-10 10 1.3 e-10 10 1.3 e-10 10 1.0 0 0 0 0 0 0 0 0 0 0 0 0 1.10 1 1.3 e-10 10 1.3 e-10 10 10 1.3 e-10 1.3 e-10 10 1.5 e-10 10 1.5 e-10 1.5 e-10 10 1.1.5 e-10 10 10 1.1.1.1.1.1 1.1.1.1.1.1.1.1.1.1 1.1.1.1 1.1.1.1.3 e-10 10 10 10 10 1.1.6 e-10 10 10 1.1.1.1.1.1.1.1.1 1 1.1.1.1.1 1.1.1.1.1.1.1.1 1.1.1.1.1 1 1 1 1 1 1 1 1.6 e-10 1 1-10 3.9e-100.9995 0.00 01 3.7e-10 1.3e-10 1.4e-10 1.3e-10 1e-09 4.5e-100.9996.25e-06 2.6e-10 1.4e-10 1.4e-10 1.4e-10 5.8e-10 4.7e-100.999 2.5e-05 5.5e-10 1.5e-10 1.7e-10 1.6e-10 1.4e-09 8.1e-100.999 0.0001 1.1e-09 1.6e-10 1.5e-10 1.5e-10 2e-09 1e-09表4:GARCH(1,1)跳跃模型的投资组合偏好,最佳绩效以绿色突出显示。英语词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇词汇0.6 4 0.62 0.52 4.5 1.80.999 0.0001 36 1.40.67 0.55 16 6.1表5:GARCH(1,1)-跳跃模型的平均协方差误差,最佳性能以绿色突出显示。错误以红色突出显示。5.5来自GARCH(1,1)-跳跃模型和随机微观结构方差的模拟数据在本节中,我们在具有随机微观结构方差的GARCH(1,1)-跳跃模型下测试我们的算法。这种微观结构噪声模型考虑了买卖价差和平方创新之间的正相关关系。该模型模拟了许多市场中观察到的经验现象[45]。

使用道具

29
kedemingshi 在职认证  发表于 2022-5-10 18:13:06 |只看作者 |坛友微信交流群
这里我们假设与GARCH(1,1)-跳跃模型相同的有效价格创新,但现在我们考虑微观结构噪声中的时变方差。在该模型中,ithasset在时间t的微观结构变化为0.1(Xi(t)-Xi(t)-1)-D) Γi,i+0.9■σo,i是固定方差和时变项的总和,这取决于有效的价格创新。这里我们看到,当平方新息等于方差时,观测噪声方差等于∑o,也就是说,在之前的模拟中,∑o,iis被选为形状为2且平均值为0.00 02的gammadistributed随机变量的实现。该模型的结果如表6和表7所示。协方差误差的比较如表8所示。从对比表中我们可以看出,非平稳微观结构模型的共变误差更大。这里,KECM-Laplace模型对σj=1e的微观结构噪声方差特别敏感-4.在某些情况下,误差增加了约10倍。KECM spike和slaband MCMC方法对随机噪声方差不那么敏感。5.6时序具有随机微观结构噪声变量的GARCH(1,1)-跳跃模型算法的平均MATLAB时序如表9所示。运行模拟的机器有Windows 7操作系统和一个带有32.0 GB内存的英特尔i7-3740处理器。该表显示,成对刷新方法的计算成本最低,而MCMCmethod需要的运行时间最多。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-12 21:50