楼主: mingdashike22
1240 55

[量化金融] 基于流动性的限价订单随机模拟框架 [推广有奖]

21
何人来此 在职认证  发表于 2022-5-11 16:42:44
因此,我们建议通过一种称为间接推理的基于模拟的方法来估计模型。特别是,我们开发了一个新的扩展到这些基于统计模拟的似然推理程序,称为间接推理。4.1间接推理的背景与基于模拟的似然推理相关的大量学术工作,我们关注史密斯[1990年、1993年]和古里鲁[1993年]提出的被称为间接推理的子类,并在格兰特和陶兴[1996年]、古里奥鲁[2006年]以及英古里奥鲁和蒙福特[1997年]的书长报道中进行了广泛介绍。在最基本的层面上,间接推理是基于仿真的随机模型中的参数估计技术。这些模型无法评估数据生成模型的密度,但可以在给定一组参数的情况下生成数据。然后,可以将模拟数据与观测数据进行比较,并在此比较的基础上获得一组参数的适用性度量。为了通过间接推理实现这一点,我们引入了一种新的模型,称为“辅助模型”,它是特定的,通常甚至不是生成的,但通常可以通过例如最大似然估计来轻松估计。这个辅助模型有自己的参数向量β,带有点估计器bβ。辅助模型的这些参数描述了观测值分布的各个方面。

22
何人来此 在职认证  发表于 2022-5-11 16:42:47
间接推理的思想是简单地尝试匹配观测数据y(由bβ(y)给出)上估计的辅助模型参数和模拟数据y上估计的辅助模型参数*(θ) ,通过使用实际模型θ的参数(由bβ(y)给出)进行模拟得到*(θ)).我们可以看到,间接推理只要求我们想要估计的模型可以被模拟,并通过为模拟和真实数据建立一个更简单的辅助模型来进行。然后,通过最小化辅助模型的参数向量与模拟数据和真实数据之间的差异,获得模型参数的估计值。在考虑辅助模型的选择时,人们可能考虑的最简单形式是,对真实观测数据(如y)和模拟合成数据y计算的单一汇总统计数据进行比较*. 或者,可以考虑考虑使用求和辅助参数向量的方法,例如Winker等人[2007]考虑最小化估计矩的真实数据向量和合成模拟数据等价物之间的加权L2二次误差函数。其他采用此类方法的人包括McFadden【1989年】和Pakes及Pollard【1989年】,他们各自提出了矩估计方法的定义,称为模拟矩方法(MSM)。其他基于模拟的替代估计技术包括模拟最大似然法(SML)和模拟分数法(MSS)。

23
何人来此 在职认证  发表于 2022-5-11 16:42:50
此类技术已被用于许多经济模型的估计,例如动态随机一般均衡(DSGE)模型Ruge Murcia[2007]和资产定价的马尔科夫模型Duffee和Singleton[1993]。在本文中,我们考虑的辅助模型是基于分析的LOB随机过程的各个方面。我们考虑的关键特征包括LOB中的价格变化和交易量。特别是,我们希望捕捉日内对数收益率波动性的聚类,以及LOB前n级总交易量的动态行为。具体来说,获得间接推断估计器的顺序如下:1。将观察到的LOB状态序列L1:T转换为辅助模型数据sety=T(L1:T)。利用观测到的辅助模型数据y,估计辅助模型参数bβ(y)。初始化随机代理LOB模型的参数向量,在我们的例子中,流动性提供者和流动性需求者代理模型参数θ(0)。然后模拟LOB模型L的综合实现*1:Tθ(0)来自随机代理模型。4.以LOB状态L的合成序列为例*1:Tθ(0)并将其转换为辅助模型数据集*(θ(0))=TL*1:Tθ(0).5.使用合成辅助模型数据y*(θ(0)),估计辅助模型参数bβY*(θ(0)).6.估计辅助参数向量之间的马氏距离或欧氏距离bβ(y),bβ(y*(θ(0)))7.设置最佳参数向量Bθopt=θ(0),距离Dmin=Dbβ(y),bβ(y*(θ(0))).8.

24
可人4 在职认证  发表于 2022-5-11 16:42:53
使用建议的参数向量θ(j)重复步骤3至7,直到收敛,或对于j个总迭代,步骤(vii)有条件地应用于eventDmin>Dbβ(y),bβjY*θ(j)关于从这种数据生成过程中获得的估计量,我们已经知道了一些理论性质,参见Smith[2008]和Genton and Ronchetti[2003]中的讨论。在某些假设下,可以证明间接推理过程产生了模型参数的点估计量,该点估计量在相当不受限制的正则性条件下是一致且渐近正态的(Gourieroux和Monfort[1997]):1。为了估计辅助模型参数β,我们使其最大化的可能性趋于渐近非随机极限。2.该极限在仿真模型参数θ中是连续的。所谓的绑定函数将辅助模型的参数与我们试图估计的实际模型的参数联系起来,它是一对一的,它对辅助模型参数的导数是满列秩的。此外,当模型对观测数据进行了正确描述时,间接推理可以证明是渐近有效的。4.2多目标间接推理用于基于模拟的模型校准为了对我们的代理随机模型进行估计,我们开发了一种基于模拟的估计程序的新扩展,它结合了两个关键思想:基于间接推理的基于模拟的似然推理,以及通常用于遗传搜索算法的多目标优化方法。我们将估计方法的结果类表示为多目标II。提出的多目标II估计框架,即非标准间接推断,旨在允许一个人使用多个辅助模型,每个模型捕捉LOB随机过程的不同特征。

25
mingdashike22 在职认证  发表于 2022-5-11 16:42:56
从这个意义上说,这是标准间接推理程序的多目标扩展,它自然允许我们探索LOB给出的目标随机过程的相关特征。为了继续说明多目标II估算方法,除了第3节中描述的LOB模拟框架外,我们还需要指定o辅助模型,每个模型由一组参数向量进行参数化,通常用β表示,根据观测数据随机过程的特征,我们希望用我们的模型来近似量化辅助模型参数与真实数据(我们将使用shorthandbβ来表示Bβ(y))之间差异的目标函数,以及量化辅助模型参数与合成生成数据之间差异的目标函数(我们将使用shorthandbβ)*(θ) forbβ(y)*(θ) )o在对随机代理LOB模型校准执行基于仿真的优化时,搜索方法将探索基于随机代理的模型的参数空间。4.2.1辅助模型辅助模型有时被称为估计函数,用于捕获我们希望在模拟中反映的真实数据的各个方面,即它们不一定必须与数据生成过程密切对应,但每个模型都应捕获一些相关特征,这些特征将通知随机模拟模型参数的估计。在标准的间接推理方法中,只有一个辅助模型,通常来自一类相对简单的模型,有关选择的指南,请参见Heggland and Friessesi[2004]。在我们的框架中,对于给定的候选参数向量θ,我们生成LOB过程轨迹的M个实现,即。L*,mt(θ)t> 0米∈{1,2,…,M},来自基于随机代理的LOB模型。

26
mingdashike22 在职认证  发表于 2022-5-11 16:42:58
然后,对于每一个由向量参数化、通常由β表示的辅助模型,我们利用模拟数据获得辅助模型参数的估计,例如通过最大似然框架:bβ*(θ) =arg maxβMXm=1TXi=1log(f(T(Lmt(θ))|T(L*,mt-1(θ)); β)). (16) 原则上,可以根据特定应用的需要采用尽可能多的辅助模型。然而,有几位作者探讨了在多目标优化框架下,目标函数K的数量对估计性能的影响。例如,Purshouse和Fleming[2003]以及Hughes[2005]认为,基于帕累托排序的方法,比如本文中使用的方法,与目标数量的比例很低。K–oppen等人[2005]解释说,目标数量的增加可能会对优化产生负面影响,因为基于帕累托最优的多目标框架中的主导概率将为零。有大量目标的第二个问题是,很难定性地比较结果,因为在有K个目标的任务中,一组解决方案存在于K中- 1超空间。基于这一指导,我们着重于捕捉LOB随机过程的两个核心特征,这两个特征与价格的演变和书的顶部附近的卷的性质有关。辅助模型1-价格特征:如果我们将中间价格表示为pmidt=pa,1t+pb,那么日志返回定义为rt=lnpmidt-这里这是一个合适的间隔,在我们的情况下是1分钟。图3显示了典型股票GDF Suez一天的日志收益时间序列。这个说明性的时间序列显示了中等价格动态的典型特征,例如异方差性。ARCH-LM测试正式证实了ARCH效应的存在。因此,波动率σt=pV ar(rt | rt-1.

27
何人来此 在职认证  发表于 2022-5-11 16:43:01
)不是常数,可以用广义自回归条件异方差模型或GARCH(p,q)模型捕捉,其中rt=σtη和ηt~ N(0,1),我们对平方效用σt=a+art-1+ . . . + 阿普特-p+bσt-1+ . . . + bqσt-QAI在哪里≥ 0,北京≥ 就我所知,0∈ {1,…,p}和j∈ {1,…,q}。为了简化辅助模型,我们对这方面的数据使用了aGARCH(1,1)模型,由β=(a,a,b)参数化。辅助模型2——交易量特征:在图4中,我们展示了一个典型的GDF苏伊士股票交易日买卖双方交易量的例子。我们将ARIMA模型应用于该数据,以捕获LOB卷的时间序列结构。在模型识别过程中,我们会犯吝啬的错误,因为我们希望在间接推理过程中获得一个参数很少的辅助模型。我们首先通过计算第一个差异,消除了在一天中LOB量时间序列中观察到的线性趋势,见图4。图4给出了结果样本ACF和PACF,表明anMA(1)模型是合适的。因此,我们将ARIMA(0,1,1)模型应用于体积数据。4.2.2结合多目标优化和间接推断迄今为止,对于随机LOB代理模型中的一组给定参数,我们模拟了订单预订过程。然后利用这些模拟数据构建一个框架,在该框架中,我们获得了多个fittedparameter向量,每个辅助模型对应一个向量。

28
mingdashike22 在职认证  发表于 2022-5-11 16:43:11
我们现在需要考虑如何判断模型参数向量在捕捉真实观测的LOB随机过程动力学时的适用性。在标准的基于间接推理的框架中,人们会将所有辅助模型输出参数向量估计连接到一个辅助模型参数向量中,以便在模拟数据和实际数据之间产生一个单一距离度量或差异。这种连接会导致信息丢失,例如,一些辅助参数模型差异可能与其他差异在不同的尺度上。因此,如果应用了一个简单的连接,这通常会导致一些特定的标准占主导地位,而不是单独考虑每个组件。我们通过引入多目标优化框架来克服这个问题。当通过一系列辅助模型来评估随机代理LOB模型参数的适用性时,这种方法自然会调整基于模拟的估计,以考虑竞争标准。因此,多目标优化方法使我们能够将差异分数的多个距离度量作为独立的目标函数来考虑。在这个框架中,通过模拟生成模型并量化每个辅助模型参数之间的差异,来衡量随机代理LOB模型参数向量θ的适用性。每个辅助模型都适用于观测数据的转换以获得(bβk)和模拟LOB数据的转换(bβk)*k(θ)),通过测量两者之间的距离来计算差异分数。最常用的距离度量基于某种形式的加权或未加权范数,例如Lp范数或p阶的Minkowski距离,其中L∞-norm,L-norman和L-norm在实践中经常使用。

29
可人4 在职认证  发表于 2022-5-11 16:43:14
我们采用L-范数来衡量我们所考虑的基于价格和基于体积的辅助模型的差异,通常为第k辅助模型byDk(θ)=D给出bβk,bβ*k(θ)=qkXi=1hbβkii-血红蛋白β*k(θ)Ⅱ. (17) 对于每个qk维辅助模型,k=1,K.4.2.3多目标优化和帕累托最优的作用当我们搜索应满足多目标函数的最优参数向量θ时,向量(θ):=[D(θ),…,DK(θ)]要最小化,在许多情况下,每个单独目标都不会有全局最小值。在这种情况下,可以考虑将帕累托最优的概念作为优化方法产生的单一最优值的替代方案,并参考帕累托效率前沿。非正式地说,这是对解决方案的搜索,因此在搜索空间中没有任何解决方案可以在不恶化另一个标准的情况下单方面改进单个标准(目标函数),这在我们的估计框架的定义4中正式定义。定义4(参数解的帕累托最优优势)。考虑产生参数向量{βK}K的K辅助模型集∈{1,2,…,K},每个都基于一个基本参数向量θ∈ Ohm, 对于选定的目标函数,产生值D(θ):=[D(θ),…,DK(θ)]。然后选择θ∈ Ohm 对于可行区域内的解集,称为局部最优或(非支配)最优Ohm, if@eθ ∈ Ohm s、 td(eθ) D(θ),(18)这里我们说D(θ)支配D(eθ),用D(θ)表示 D(eθ),ifDk(θ)≤ Dk(eθ)K∈ {1,2,…,K}和k s.t.Dk(θ)<Dk(eθ)。

30
nandehutu2022 在职认证  发表于 2022-5-11 16:43:17
(19) 由此,我们可以陈述总体目标,包括所有K个辅助模型和基于随机代理的模型的参数向量θ的L2范数目标函数的共同选择,如下所示Bθ=arg minθ∈Ohm[D(θ),…,DK(θ)]=arg minθ∈Ohm钕^β,^β*(θ), . . . , DβK,β*K(θ)o=arg最小θ∈Ohm(qXi=1)h^βii-h^β*(θ) 二,, . . . ,qKXi=1h^βKii-h^β*K(θ)Ⅱ)受制于θL≤ θ≤ θU。。。,θnL≤ θn≤ θnU(20),其中[θiL,θiU],表示可行域的边界Ohm.为了完成我们提出的基于多目标间接推理模拟的估计框架,我们需要一种搜索约束参数空间的方法Ohm 求可行解和帕累托最优解。在这种情况下,可以使用多种随机搜索方法,参见Coello等人[2007]中的讨论。为此,我们提出了一种进化遗传搜索方法,在文献中称为多目标进化算法(MOEA)。我们开发了这种随机搜索框架的一个版本,它结合了Deb等人[2002]广泛使用的NSGA-II遗传搜索算法,这是一种基于Pareto Ranking的方法,以及我们根据Peters等人[2012]开发的框架专门为协方差矩阵变异算子设计的额外变异核。这一额外的突变成分与NSGA-II框架相结合,以确保在搜索的每一步提出的随机代理LOB模型中的协方差矩阵保持正定义和对称。该遗传搜索算法的详细信息见附录A.5随机代理LOB模型评估和校准realLOB数据我们描述了我们开发的基于随机代理的LOB模型,用于建模贸易往来及其依赖关系。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 18:43