楼主: mingdashike22
682 19

[量化金融] 基于经济Agent的模型标定方法比较 [推广有奖]

11
可人4 在职认证  发表于 2022-6-25 05:05:39
广义地说,这些方法涉及构建一个目标函数,该函数测量给定参数集的模拟和测量时间序列之间的距离,然后应用优化方法。更准确地说,我们有argminθ∈Θf(θ),(1)其中θ是参数向量,Θ是可行参数空间,f:Θ→R是一个测量真实和模拟时间序列之间距离的函数。虽然真正通用和标准化的方法尚未出现在经济ABM中,在早期文献中,考虑模拟和经验测量力矩(或其他可从时间序列数据估计的量)之间平方误差加权和的方法变得非常突出(Gilli and Winker 2003),模拟力矩法(MSM)已应用于无数研究中。考虑MSM的主要动机包括其在整个计量经济学文献中的流行程度、其透明度(Franke 2009)以及其充分理解的数学特性。然而,MSM并非没有许多缺点。一个最重要的问题是,矩的选择完全是任意的,给定的一组矩只能代表有限数量的数据聚合属性,因此可能无法充分捕捉重要的动态。此外,使用Winker et al.(2007)所述方法获得的权重矩阵是本文中的标准方法,在某些情况下,由于近似奇异矩阵的反演,可能会导致数值挑战(Fabretti 2013;Platt和Gebbie 2018)。一种相关的方法是间接推理(II),由Gourieroux等人(1993)介绍。与依赖估计的矩不同,II涉及使用所谓的辅助模型,基本上是一个简单的模型,可以通过分析方法(如最大似然法)进行估计。

12
何人来此 在职认证  发表于 2022-6-25 05:05:42
通过根据经验测量和模拟数据估计辅助模型并比较获得的参数,构建目标函数,最小化意味着两组估计参数之间的最大相似性。总的来说,II面临着与针对MSM的批评类似的批评(Grazzini等人,2017年),因为它涉及到任意辅助模型的选择。2.3.2频率推断:模拟最小距离的新方法如前所述,SMD的传统方法,如MSM和II,存在许多弱点,其中最重要的是需要选择任意一组矩或辅助模型。不足为奇的是,出现了许多替代者,旨在解决这一特定问题,他们关注给定时间序列的结构及其模式,而不是聚合属性,试图利用数据的全部信息内容。在这些备选方案中,最直接的方法是选择objectivefunction作为模拟时间序列和经验测量时间序列在若干时间点的值之间的适当加权平方差之和,正如Recchioni et al.(2015)所做的那样。Lamperti(2017)和Barde(2017)以信息论标准的形式提出了更复杂的量化模拟和经验测量时间序列结构差异的方法,称为广义减去L-发散10参见Franke(2009)、Franke和Westerhoff(2012)、Fabretti(2013)、Grazzini和Richiardi(2015),例如Chenand Lux(2016)和Platt and Gebbie(2018)。11估计量既一致又渐近正态(McFadden 1989)。12 Bianchi et al。

13
能者818 在职认证  发表于 2022-6-25 05:05:45
(2007).(GSL div)和马尔可夫信息准则(MIC)。正如Guerini和Moneta(2017)所建议的那样,近年来也出现了通过使用SVAR回归来比较真实和模拟数据背后的因果机制的尝试。虽然上述方法在很大程度上成功地缓解了与选择任意矩或辅助模型相关的担忧,但它们带来了新的挑战。虽然MSM和II已经很好地理解了理论特性,但最近引入的许多替代方案尚未经过严格的数学分析(Grazzini et al.2017)。因此,不同校准方法之间的比较往往是非常重要的,因为上述许多技术在概念上几乎没有相似之处,而支持特定方法的大多数论点可能是非常重要的。这使得建模者可以在大量潜在校准方法之间进行选择,而做出此类决定所依据的证据却很少。2.3.3贝叶斯推理虽然在文献中不太常见,但传统SMD方法的另一种替代方法是贝叶斯推理,它不需要选择任意的聚合特征,也允许合并有关参数值的已知、先验信息(Grazzini et al.2017)。这是通过以下Bayes定理的应用实现的:P(θ| X)∝ P(X |θ)P(θ),(2)其中X代表经验测量数据,P(θ)代表参考参数值的先验观点,P(X |θ)是使用参数集θ初始化时模型生成X的可能性。与产生点估计的SMD方法相比,很明显,我们并没有得到一个单一的参数集,而是得到一个分布。

14
能者818 在职认证  发表于 2022-6-25 05:05:48
然而,可以通过取平均值、中值或模式来分析该分布,以产生合适的点估计。该方法提出的最大挑战是对似然度P(X |θ)的估计。Grazzini等人(2017年)指出,核密度估计(KDE)等非参数方法在计算上的要求可能太高,在大多数ABM应用中都不可行,需要相当强的假设,而参数方法往往不够灵活,无法准确表示分布。2.3.4解决计算困难虽然新方法之间缺乏比较确实是ABM校准文献的一个显著弱点,但计算困难仍然是制定稳健且广泛适用的ABM校准策略的更大障碍。由于大多数感兴趣的模型的模拟成本可能很高,并且在mostABM校准框架中需要生成大量数据进行比较,因此很少有人尝试校准大规模BMS。相反,大多数调查倾向于在更简单、封闭形式的模型上进行概念验证演示,如Brock和Hommes(1998)和Farmerand Joshi(2002)的模型。

15
mingdashike22 在职认证  发表于 2022-6-25 05:05:51
归根结底,尽管大型模型和简单变体在概念上有相似之处,但现有结果的普遍化程度仍然是一个悬而未决的问题。13有关GSL div和MIC的更详细讨论见第3.3.14节。值得注意的是,也可以直接将P(X |θ)最大化,而不是在aBayesian框架内使用,从而得到基于模拟的最大似然估计近似值。虽然Kukacka和Barunik(2017)将该程序应用于Brock和Hommes(1998)模型,取得了一定程度的成功,但总体而言,贝叶斯方法对过度拟合更为稳健,thusbetter更适合于更复杂的模型(Murphy 2012)。15我们在第3.3节中更详细地描述了Grazzini等人(2017)的方法。最近,一些群体对这一点的认识有了相对温和的提高,并且越来越重视解决某些圈子的计算困难(Grazzini等人,2017年;Lamperti等人,2017年)。一个有希望的建议是使用代理建模来绕过密集的ABM模拟过程,具有代表性的例子包括高斯过程插值,也称为克里格(Salle和Yildizoglu 2014),以及Lamperti等人(2017)更通用的机器学习代理方法。近年来,也出现了云计算平台,如Mazon Web Services,它为用户提供了对计算资源的访问,这些资源基本上是为完成所需任务而租用的,而不是直接购买的,授予用户访问计算能力的权限比通过传统的现场手段可能要大几个数量级。

16
可人4 在职认证  发表于 2022-6-25 05:05:54
因此,使用此类服务可以为研究人员提供解决更大校准问题的方法,而无需求助于代理建模。事实上,这就是本次调查所采取的方法。3实验程序为了有效比较各种校准技术,有必要制定一系列测试,量化校准成功的概念,并得出可直接比较的测量结果。有人可能会假设,自然方法是使用各种不同的方法对一组候选模型进行校准,以根据经验观察到的数据,并评估结果的拟合优度。不幸的是,由于许多原因,这种方法可能是次优的。首先,无论候选模型的质量和复杂程度如何,与真实的数据生成过程相比,在某种程度上,尤其是在经济背景下,它很可能是错误的。例如,给定的模型可能过于简单,无法捕捉基础数据生成过程的细微差别,从而导致对数据的拟合较差,无论每种校准方法的优点如何。其次,在作业成本管理的背景下,很难量化信息优度的概念。事实上,每个SMD目标函数都是对其进行量化的尝试,每个目标函数在他们认为最重要的数据特征方面都有所不同。因此,我们介绍了一种校准方法比较的一般方法,以解决上述问题。3.1损失函数构造和比较程序首先让Xsi(θ,T)为参数集θ、输出长度T和随机种子i的候选模型M的输出,其中上标s的使用表明所描述的量来自模拟数据,或与模拟数据相关,而非真实数据。

17
kedemingshi 在职认证  发表于 2022-6-25 05:05:57
由于经验观测数据只不过是真实数据生成过程的一个单一实现,其本身可以被视为一个具有自己参数集的模型,因此我们可以考虑X=Xsi*(θtrue,Temp)作为实际数据的近似值,M可以校准到该数据。在这种情况下,我们基本上是根据已知真实参数集θtrue的数据来校准一个完全特定的模型。可以说,在这种理想化的环境中,一种好的校准方法将能够在一定程度上恢复真实的参数集,而产生更接近θtruer的估计值的方法将被认为是优越的。此外,执行方法16参考Barde和van der Hoog(2017),首次尝试使用类似方法校准大规模经济ABM。17在这种情况下,我们考虑单变量时间序列,但类似的参数适用于面板数据。在这种情况下,在更现实的模型错误情况下,更可能表现良好。因此,我们定义了损失函数l(θtrue,^θ)=θtrue-^θ(3),其中^θ是给定校准方法产生的参数估计。

18
可人4 在职认证  发表于 2022-6-25 05:05:59
因此,使用这种方法,我们不仅可以解决与误判模型相关的问题,还可以根据相关损失函数值直接比较校准方法。当然,我们并不认为这是校准方法比较的定义工具,但确实认为这是一种原则性方法,能够在这方面提供有意义的见解。鉴于我们现在已经确定了一个指标,允许校准方法直接比较给定模型M和真实参数集θtrue,因此开发一系列全面的比较测试相对来说是很有必要的。我们首先注意到,给定测试的难度取决于三个因素:M产生的动力学的复杂性、θtrue中的自由参数数量以及M校准到的时间序列数据的长度、温度。因此,我们必须考虑一组模型M,其中每个模型在其合成动力学的复杂性和整体性质上有所不同,以及每个模型的不同基数的各种真实参数集。然后,我们可以确定与各种模型和真实参数集的每个校准方法相关的损失函数值。这将最终深入了解哪种校准技术在哪种情况下具有最佳性能。在这一点上,应该注意到,我们所考虑的模型通常不会是遍历的。因此,每个校准实验都需要比较我们的真实数据代理Xsi*(θtrue,Temp),每个候选参数集的R蒙特卡罗复制的集合,Xsi(θ,Tsim),i=i,i+1,i+R- 1,其中∈ N我们假设*6.∈ {i,i+1,…,i+R- 1}.3.2实施模型我们现在提供实施模型的描述和简要动机,供他们在本研究中考虑。

19
mingdashike22 在职认证  发表于 2022-6-25 05:06:02
前四种方法计算成本较低,经常出现在现有校准文献中,并且能够产生从非常基本到相对复杂的动力学。选择这一初始集合是为了确定所考虑的方法中最有前途的方法,在这种简化的背景下表现良好的方法将被应用于计算成本更高、规模更大的英国住房市场ABM。初始模型集的计算成本较低,这使得我们能够在实际时间段内进行一系列全面的测试,包括所有考虑的校准方法,之后,只有可能成功的方法才能应用于更复杂的环境。事实上,在这种简化的背景下表现不佳的方法在应用于英国住房市场模型时,几乎肯定会表现不佳,因此我们不需要在此类测试上浪费计算资源。3.2.1 AR(1)模型我们考虑的第一个模型是阶数为1的自回归模型,由xt+1=axt+et+1给出,(4)其中et~ N(0,1)。18请注意,我们在实验中不会改变经验时间序列长度,因为与自由参数数量和模型动力学复杂性相关的影响通常占主导地位。19感兴趣的读者应参考Grazzini(2012)详细讨论遍历性及其与ABM校准的关系。显然,上述是一个基本的单参数模型,能够产生有限的动力学范围,其校准应该是一项微不足道的工作。

20
何人来此 在职认证  发表于 2022-6-25 05:06:05
包括它是为了创建一个基线测试,我们期望所有考虑的校准方法都能很好地执行该测试。3.2.2 ARMA(2,2)-ARCH(2)模型我们考虑的第二个模型是具有ARCH(2)误差的ARMA(2,2)模型,假设yxt+1=a+axt+axt-1+bσtet+bσt-1台-1+σt+1et+1,σt+1=c+cet+cet-1,(5)其中et~ N(0,1)。上述是先前考虑的AR(1)模型的逻辑继承,因为它来自同一个普通类,即传统的计量经济时间序列模型,但能够产生更细微的动态,并且具有显著更大基数的参数空间。此外,使用分析方法对此类模型进行校准相对简单。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 07:43