楼主: nandehutu2022
1000 27

[量化金融] 经济物理学的真实性检验:基于可能性的拟合 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-6-9 18:01:21
与此相反,GARCH模型中的参数纯粹来自统计轮次,不能轻易与代理行为关联。从贝叶斯的角度来看,式(1)和式(2)对应于似然p(x |θ),即给定模型参数的观测数据的条件概率。为了完成模型密度p(x,θ),我们需要指定参数的先验分布。先验分布的选择通常被认为是主观的(而可能性有一种客观主义的光环)。可以说,从建模观察数据的角度来看,这种区别的相关性有限。相反,请注意,对之前的数据进行筛选会隐含地确定数据空间上的分布,即通过边缘化参数获得p(x)=Rp(x,θ)dθ。当模型将很低的概率分配给实际观测数据时,可以认为该模型是错误的。相反,一个好的模型应该能够以合理的概率生成类似的数据。这种观点与[9]一致,他们认为先验只能在可能性的上下文中理解。事实上,先验和可能性在塑造模型和表达我们对合理数据的期望方面共同作用。在这里,我们建议使用(弱)信息先验,这考虑到我们在生成时对参数所起作用的了解。我们也已经确定了确切的模型,即对变换后的回归Mt=ert+1进行正态分布-无任何明显差异。对该近似模型的仿真结果表明,该模型生成的价格序列与原模型具有相似的强波动性聚类。来自似然模型的数据。例如,考虑参数τ∈公式(1)的(0,1)。

12
能者818 在职认证  发表于 2022-6-9 18:01:25
虽然简单地分配一个统一的先验值可能很自然,但τ控制着运行价格平均值的时间常数,即hptiτ=(1- τ)pt+τhpt-1iτ=(1- τ)pt+τ((1- τ) pt公司-1+τhpt-2iτ)=(1- τ )∞Xk=0τkpt-kasτk→ k为0→ ∞. 将其与指数加权平均不连续时间进行比较,即hptiρ=Z∞ρe-ρspt-sdswith时间常数ρ-1和指数加权核k(s)=ρe-ρsof单位重量,即R∞k(s)ds=1,我们将τk与e匹配-ρk.因此,解释-logτ为运行平均值的时间常数。图(1)根据时间尺度上的诱导先验,比较了τ上的U nif orm(0,1)和β(10,0.5)。类似地,u被赋予一个伽马(3,0.03),该伽马将其95%以上的概率质量分配给区间[20250]。这些先验知识一起通知VS模型远离边界u→ 0或τ→ 0,即P(| St |=1)≡ 1,因此σt≡ σmax。因此,在这种情况下,无法预期生成显示出明显波动性聚类的数据,事实上,在原始参考文献[19]中,价格平均值超过10个时间步,而所选的先验知识很好地涵盖了这些时间步。在Stan中直接实现这两种模型,完整代码见附录A.2和A。分别为1。3.2 Franke&Westerho ff(FW)建立的模型Franke&Westerho ff开发了一系列模型,并使用矩匹配方法进行了估计[8,7]。在这里,我们遵循他们在[8]中的介绍,并在术语中介绍DCA-HPM模型。在FW模型中,市场上有两种类型的经纪人,分别是基本面交易员和图表交易员。基本面交易者在时间步t的分数由nft表示∈ [0, 1]. 图表交易者的相应分数由nct=1给出- nft。

13
能者818 在职认证  发表于 2022-6-9 18:01:28
原木价格,用pta表示,根据基本数据和图表的平均需求进行调整,dctraders aspt=pt-1+u(nft-1英尺-1+nct-1dct-1) (3)需求由确定性和随机性组成。假设基本面交易者对错误定价作出反应,即与(已知)基本面价格p之间的差异*, 然而图表交易者对过去的反应是,统一的先验知识,尤其是无界空间上的先验知识,不应被视为具有信息性。一方面,不适当的统一先验知识,即当其无法归一化时,通过将有限概率质量分配给任何有限阈值以上的值,表达了对极端参数值的强烈相信。另一方面,它们不是如上示例所示的不变的模型下重新参数化。β(10,0.5)Uniform1 100 10000 1 100 100000.000.250.500.75时间常数-1对数τ探头。密度图1:参数τ的均匀(0,1)和β(10,0.5)之前的比较。每个柱状图由25000个之前的绘图组成,并显示相应时间常数的诱导分布-对数τ。请注意,统一优先级将相当大的概率质量放在以下时间步长的非常短的时间常数上。价格变动,即pt-pt公司-1、根据[8],需求动态建模为SDFT=φ(p*- pt)+英尺英尺~ N(0,σf)dct=ξ(pt- pt公司-1) + 计算机断层扫描计算机断层扫描~ N(0,σc)注意,这些需求没有被观察到,因为只有它们的加权和影响价格。虽然这种动态可以通过随机的延迟状态来建模,但在目前的情况下,有可能将需求边缘化。

14
kedemingshi 在职认证  发表于 2022-6-9 18:01:31
由于两个正态分布随机变量的总和再次为正态分布,组合需求产生了对数返回rt=pt的随机模型- pt公司-1rt~ Nu(nft-1φ(p*- pt公司-1) +nct-1ξ(pt-1.- pt公司-2) ),u((nft-1) σf+(nct-1) σc)(4) 挥发性σt=uq(nft-1) σf+(nct-1) σcnow取决于Chartist与基本面交易者的比例以及随时间的变化。[8] 与经济学中的结构模型类似,将这种结构称为随机波动,因为基于代理的模型的参数基于行为术语,因此具有经济意义。然后,该模型由每组中贸易商分数的更新方程完成。这里,我们考虑了[8]的DCA-HPM规范,该规范由NFT=1+e给出-βat-1(5)nct=1- nftat=α+αn(nft- nct)+αp(p*- pt)(6)参数At表示图表策略基础的相对吸引力。它包括一般倾向α和放牧αn>0以及错误定价αp>0的影响。我们选择此规格有两个原因:1。式(5)中的离散选择方法(DCA)可获得平滑可区分的模型密度。这简化了使用HMC算法进行采样时的后验探索。2、无需获取实际需求DFT和dct,即可计算吸引力公式(6)的羊群+倾向+错位(HPM)规格。对于[8]中的其他规范而言,情况并非如此,因为代理人的财富取决于之前的需求,这反过来又导致了随机波动模型,其中(其中一个)需求必须建模为随机潜在变量。为简单起见,我们在本论文中没有考虑这种复杂性。总的来说,模型动力学由式(4)、式(5)和式(3)完全规定。

15
何人来此 在职认证  发表于 2022-6-9 18:01:34
(6).模型参数由θF W=(u,φ,σF,ξ,σc,β,α,αn,αp,p给出*).请注意,β和u是多余的,因为它们只是分别控制α、αn、αpandξ、φ、σf、σ的比例。因此,在整个过程中,我们将其固定在β=1和u=0.01,如在[8]的模拟练习中所示。在模拟数据时,我们进一步假设基本原木价格已知并固定在p*= 在下面估计实际股票收益率模型时,我们不知道基本价格。在这种情况下,继[14]之后,我们假设对数基本价格是随时间变化的布朗运动*t型~ N(p*t型-1, σ*)这不仅引入了另一个参数σ*但也使该模型成为一个随机波动率模型,即波动率σtnow包含一个随机分量。要查看此注释,σt位于-2通过nft-1吸引力依次包括随机基本对数价格p*t型-然而,在Stan中实现该模型是很容易的。与之前一样,FW模型的完整代码见附录A.3。注意,布朗运动的时变噪声p*t在参数块中作为N维向量(其中N表示观察到的时间步数)。此外,我们还使用了一种非中心参数化,即p\\u星是从epsilon\\u星计算出来的,作为变换参数。形式上,我们可以表示如下:*t=p*t型-1+ σ**t此处*t型~ N(0,1)代替P*t型~ N(p*t型-1, σ*)这是一个标准的重新参数化示例,它不会更改模型,但有助于将HMC采样作为原始参数*tall具有单位标度,无论哪种方差σ*当前已采样。在这里,我们用所有参数的弱信息先验来完成模型。

16
nandehutu2022 在职认证  发表于 2022-6-9 18:01:38
由于很少有关于吸引力参数α的正确选择的见解,α和αpwe分配了弱信息先验,例如alpha\\u 0~ student\\u t(5,0,1)限制了参数的比例,但由于尾部较重,允许使用更大的值。对于标准偏差参数σf、σcand和σ*我们施加更强的先验知识,并借助观测数据来设置适当的尺度。虽然不是纯粹的贝叶斯,但这种选择将模型限制在合理的范围内,因为波动率可以用任意单位来衡量,例如每年百分比。总的来说,我们发现这些先验知识在模拟研究中以及在根据股票数据估计模型时都是有效的。4结果在这里,我们给出了上述模型在模拟和实际价格数据上的估计结果。4.1模拟研究为了检查我们的模型实施情况,我们使用【8】表1中给出的参数模拟FW模型,即u=0.01,β=1,φ=0.12,ξ=1.50,α=-0.327,αn=1.79,αp=18.43,σf=0.758,σc=2.087和p*= 然后,我们重新估计了模拟价格序列的模型参数ofT=2000时间步,如图(2)所示。ptrtntcntf0 500 1000 1500 2000 0 500 1000 1500 20000 500 1500 2000 0 500 1000 1500 20000.20.40.60.81.0-0.050-0.0250.0000.0250.0500.00.20.40.60.8-0.3-0.2-0.10.00.1时间步长图2:FW模型的模拟价格和收益序列。请注意,基本面交易者NF中的一小部分与波动的市场阶段相吻合。相比之下,正态先验分布会带来更多信息,因为基本上排除了几十个标准差之外的值更大。对于本练习,我们修改了app的模型代码。A、 3以便基本价格固定在p*≡ 0

17
何人来此 在职认证  发表于 2022-6-9 18:01:41
这与数据生成过程以及[8]中的calibrationexercise相匹配。后验分布得到的样本如图(3)所示。总的来说,我们从独立的随机初始条件开始运行四个链,在丢弃其他400个样本的初始瞬态作为预热后,从每个链中抽取400个样本。与其他研究相比,样本数量似乎非常少,但在追踪图中可以清楚地看到样本的高质量。该模型似乎在大约50个样本后就收敛了,所有链都从相同的分布中产生几乎不相关的样本。这也得到了标准收敛诊断的证实,如Gelman&Rubin\'s^R,它比较链之间和链内的方差,或基于样本自相关的有效样本数(未显示)。如果需要,可以很容易地提取更多样本,因为在标准笔记本电脑上运行所示的估计数只需几分钟。图(4)显示了产生的posσcαnαpσfφξα00 200 400 600 800 200 200 800 200 600 800 200 600 200 200 800 200 400 400 800 200 600 200 400 800 200 400 600 200 400 400 800 200 400 600 800 400 600 800 400 600 8000240.51.01.50.02.55.07.510.003060900.000.250.500.751.00012340.02.55.07.510.0chain1234图3:模型参数φ、ξ、α、αn、αp的跟踪图,σfandσc。注意,在大约50个样本后,所有链似乎都收敛到相同的后验分布。terior分布以及生成数据的真实参数。我们发现,要可靠地恢复真实参数,至少需要1000个观察价格。

18
何人来此 在职认证  发表于 2022-6-9 18:01:44
有趣的是,对5000个观测值的长时间时间序列进行的初步运行表明,后验不确定性仅略有降低,尤其是图表参数的后验不确定性,这些参数似乎难以估计,可能是因为它们仅在高波动期间才起作用。VS模型也进行了类似的实验。在这里,所有参数都是在数千次观测后精确估计的。尤其是τ的不确定性非常小,而u似乎是识别性最差的参数。表1总结了我们对FW和VS模型的实验。总体而言,我们模拟了2000个时间步长的100个时间序列,每个时间步长为σcαnαpσfφξα02.0 2.5 3.0 3.51.0 1.5 2.0 10 20 30 40 50 0.60 0.65 0.70 0.75 0.800.0 0 0 0.2 0.4 0 3 6 9-0.75-0.50-0.25 0.000100200040801200200200300501001502000306090120010020030050100150200估计真值图4:参数φ、ξ、α、αn、αp、σfand和σc的后验密度图。后验分布很好地覆盖了真值。并将后验均值作为参数的点估计。上述参数重新估计的练习基于这样的想法,即实际数据是从一组固定但未知的待恢复参数中生成的。这一点在频率统计中得到了深入的阐述,在频率统计中,估计器的属性通过其重复抽样特性进行比较,即在真实数据生成过程(如具有固定参数的模型)下,研究其在由同一样本生成的多个数据集上的性能。从贝叶斯的角度,以及从数据建模的角度来看,推理应该只基于观察到的数据集。如上所述,贝叶斯模型由密度为p(x,θ)的数据和参数的联合分布组成。

19
能者818 在职认证  发表于 2022-6-9 18:01:47
然后,数据p(x)上相应的(先验)分布捕获了我们的建模假设,关于哪些观测被认为是合理的。因此,从这个角度来看,研究这种分布的性质是很自然的,图(5)显示了从FW模型中随机生成的收益序列以及我们选择的先验值。为便于比较,标准普尔500指数的实际回报率包含在右下方的子面板中。可以清楚地看到,在该模型下,挥发性集群效应要明显得多。调查不同的优先规范,尤其是试图获得更强的波动性聚类,揭示了波动性参数σf、σc的规模与选择参数αn、αp的典型大小之间的复杂关系。事实上,看atEq。(6) 这并不奇怪,因为σcand和σf控制着预期价格波动,而预期价格波动又为αp设定了一个尺度(不太直接)。总的来说,这种数据生成练习不仅有助于理解FWmodel及其假设,而且还表明,如果从相对尺度上考虑,αn,αp将更容易解释,例如,重新参数化为eαn=αnhσti(a)FW模型估计结果参数φξσfσcαnαpTrue 0.12 1.5 0.758 2.087-0.327 1.79 18.43估计值0.23 0.97 0.75 2.14-0.28 1.83 16.9SD 0.23 0.18 0.056 0.19 0.14 0.22 6.0RMSE 0.26 0.55 0.056 0.20 0.14 0.22 6.2(b)VS模型估计结果参数uτσmaxTrue 100 0.999 0.01估计值95.9 0.997 0.011SD 11.9 7.8×10-34.0 × 10-3RMSE 12.6 8.0×10-34.2 × 10-表3:FW(a)和VS(b)模型模拟数据的估计结果。所示为在2000个时间步长的100个模拟时间序列上后验平均点估计值的平均值、标准偏差(SD)和均方根误差(RMSE)。其中hσti表示预期波动率。

20
kedemingshi 在职认证  发表于 2022-6-9 18:01:50
将这些探索留给未来的工作,我们现在开始构建标准普尔500指数的股票回报模型。4.2拟合标准普尔500指数最后,我们根据标准普尔500指数股票市场指数的价格数据拟合了所有模型。作为一个基准,标准的GARCH(1,1)模型已纳入比较。2009年1月至2014年12月和2000年1月至2010年12月的相应数据如图(6)、图(7)和图(8)所示。预计的模型波动率以及未来250天的预测覆盖在实际市场回报上。波动率估计值显示为后验平均值及其周围95%可信区间。波动率σiat时间步长iis的后验值基于在所有N个数据点上观察到的收益率的数据点,即i=1,…,的p(σi | r,…,rN),N在时间序列模型的术语中,这被称为平滑分布,与滤波分布p(σi | r,…,ri)相反-1) 这只取决于之前的观察结果。在这方面,我们的结果补充了Lux【14】的工作,Lux【14】使用顺序蒙特卡罗近似过滤分布。在时间序列的上下文中,基于滚动外观预测来评估模型通常很方便。虽然这些都可以从过滤分布中获得,但在我们的设置中需要更多的工作和模型的连续重新设置。在任何情况下,以相同的方式从后验预测分布中得出超过最后观测数据点的预测,密度(rN+1,…..r,…,rN)=Zp(rN+1,…..θ)p(θ| r,…,rN)dθ,即通过基于后验分布向前运行模型。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 18:20