楼主: mingdashike22
1022 20

[量化金融] 离散系统拟似然函数的高效计算 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-5-9 05:48:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Efficient Computation of the Quasi Likelihood function for Discretely
  Observed Diffusion Processes》
---
作者:
Lars Josef H\\\"o\\\"ok and Erik Lindstr\\\"om
---
最新提交年份:
2015
---
英文摘要:
  We introduce a simple method for nearly simultaneous computation of all moments needed for quasi maximum likelihood estimation of parameters in discretely observed stochastic differential equations commonly seen in finance. The method proposed in this papers is not restricted to any particular dynamics of the differential equation and is virtually insensitive to the sampling interval. The key contribution of the paper is that computational complexity is sublinear in the number of observations as we compute all moments through a single operation. Furthermore, that operation can be done offline. The simulations show that the method is unbiased for all practical purposes for any sampling design, including random sampling, and that the computational cost is comparable (actually faster for moderate and large data sets) to the simple, often severely biased, Euler-Maruyama approximation.
---
中文摘要:
我们介绍了一种几乎同时计算金融中常见的离散观测随机微分方程参数拟极大似然估计所需的所有矩的简单方法。本文提出的方法不局限于微分方程的任何特定动力学,并且对采样间隔几乎不敏感。本文的主要贡献在于,当我们通过一次操作计算所有矩时,计算复杂度在观测数上是次线性的。此外,该操作可以脱机完成。模拟结果表明,该方法在任何抽样设计(包括随机抽样)的所有实际用途中都是无偏的,并且计算成本与简单的、通常带有严重偏差的Euler-Maruyama近似相当(对于中大型数据集,实际上更快)。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Computation        计算
分类描述:Algorithms, Simulation, Visualization
算法、模拟、可视化
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Efficient_Computation_of_the_Quasi_Likelihood_function_for_Discretely_Observed_D.pdf (506.84 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:似然函数 Differential Contribution Quantitative Econophysics

沙发
kedemingshi 在职认证  发表于 2022-5-9 05:48:30
离散观测扩散过程的拟似然函数的有效计算拉尔斯·约瑟夫·霍奥卡、埃里克·林德斯特龙、乌普萨拉大学信息技术系科学计算分院,图框337,SE-751 05乌普萨拉,瑞典隆德大学数学科学中心,图框118,SE-22100,隆德,Swedenabstract我们介绍了一种简单的方法,用于几乎同时计算金融中常见的离散观测随机微分方程中参数的拟最大似然估计所需的所有矩。本文提出的方法不局限于微分方程的任何特定动力学,对采样间隔几乎不敏感。本文的主要贡献在于,当我们通过一次运算计算所有矩时,计算复杂度在观测数上是次线性的。此外,该操作可以通过fline完成。模拟结果表明,该方法对任何抽样设计(包括随机抽样)的所有实际目的都是无偏的,并且计算成本与简单的、往往有严重偏差的欧拉马鲁亚马近似相当(对于中大型数据集而言,实际上是最快的)。关键词:拟似然,扩散过程,条件矩,最大似然,随机微分方程2010 MSC:65C20,65C30,65C60,68U201。引言大多数应用,如涉及随机微分方程(SDE)的模拟或估计,都以某种方式与过程的转移概率有关。

藤椅
能者818 在职认证  发表于 2022-5-9 05:48:33
例如,可以直接估算电子邮件地址:josef。hook@it.uu.se(Lars Josef H¨o¨ok)在已知转移概率密度的情况下,使用最大似然法将参数提交给Elsevier 2018年8月13日,但在实践中很少出现这种情况。然而,通常可以近似计算跃迁概率密度。概率密度是通过对Lo(1988)中的Fokker-Planck方程(一个偏微分方程)的解进行蛮力数值计算得到的;Lindstr¨om(2007),而Pedersen(1995b)提出了基于蒙特卡罗的方法;达勒姆和格兰特(2002);Beskos等人(2009年);Lindstrom(2012b)及其参考文献。这些方法的计算成本很高,因此不适用于大型数据集。Ait-Sahalia(2002)提出了转移概率密度的Gauss-Hermite级数展开式,尽管该方法仅限于具有特定结构的模型。在收集和存储大量数据方面的最新进展正在将重点从计算速度缓慢但在统计上有效的最大似然法转移到计算速度更快、但在统计上不太有效的准最大似然法,因为数据的丰富性往往弥补了效率的损失。Florens Zmirou(1989)介绍了一种基于准最大似然技术的简单方法,其中条件均值和方差来自模型的Euler Maruyama离散化,参见Kloeden和Platen(1992)。从计算角度来看,这是非常有效的,Florens Zmirou(1989)表明,随着采样间隔变为零,随着偏差消失,他们的方法相当于最大似然估计。凯斯勒(1997)提出了这种方法的更高阶版本。

板凳
nandehutu2022 在职认证  发表于 2022-5-9 05:48:36
准最大似然法通常是无偏的,见Sorensen(2012),前提是平均值和方差是正确的。Florens Zmirou(1989)中的偏差;因此,凯斯勒(1997)的方法明确取决于条件矩近似的质量,参见H–o–ok和Lindstrom(2014)。本文的目的是发展一种适用于中大型数据集的离散观测扩散过程准极大似然估计的快速计算方法。我们表明,由于力矩的计算方式,计算成本是线性的而不是超线性的。(我们的模拟显示,计算复杂度与EulerMaruyama方案相当,因此比任何近似最大似然法都快)。这将在不存在与Euler Maruyama方法相关的偏差问题的情况下实现,Euler Maruyama方法实际上独立于采样间隔。论文的概要如下。在第2节中,我们阐述了统计问题,并讨论了计算条件矩的一些替代技术。接下来是第3节,我们给出了一个导致次线性复杂性的数值实现。第4节对两种不同性质的扩散过程以及随机抽样数据进行了论证,并在第5.2节得出结论。扩散过程与条件动量(Ohm, F、 P,{Ft}t≥0)是一个过滤的概率空间,让Xt(θ)是一个定义在该空间上的随机过程,它求解以下一维随机微分方程(SDE)dXt=aθ(Xt)dt+bθ(Xt)dWt,Xt=x。(1)在本文中,我们假设漂移项和扩散项是有规律的(例如:。

报纸
nandehutu2022 在职认证  发表于 2022-5-9 05:48:41
有界增长和局部Lipschitz,参见Karatzas和Shreve(2012),了解替代条件),以确保解的存在性和唯一性。估计参数θ的最佳方法是最大似然估计。设xk=x(tk),k=1,K是由等式(1)生成的观测值。最大似然估计量定义为^θMLE=argmaxθ∈其中对数似然函数由`(θ)=logpθ(x)+KXk=1logpθ(xk | xk)给出-1). (3) 跃迁几率密度pθ(xk | xk)-1) 由模型隐含定义。该模型的性质是通过分析生成器L=aθ(x)得到的x+bθ(x)x、 (4)跃迁几率pθ(xk | xk)-1) 是福克-普朗克方程的解,由伴随算子(Lu,v)=(u,L)定义*v) 在内部产品(·,·)下。福克-普朗克方程,当从xkat时间tk开始,到tk+1结束时,由tpθ(x,t)=-L*初始条件为pθ(x | xk)=δ(x- xk)。由于不连续性,这种初始条件可能会导致等式(5)的数值实现出现问题,参见Lo(1988)中的实现和Lindstrom(2007)中提出的补救措施。计算转移概率的另一种方法是使用马尔科夫性质和全概率定律,将中间变量相加并积分,参见Pedersen(1995b,a)Let tk-1<s<tk。然后它保持pθ(xk | xk-1) =Zpθ(xk,xs | xk)-1) dxs=Eθ[pθ(xk | xs)|xk-1] (6)蒙特卡罗方法可以很容易地逼近预期值,但大多数应用都需要使用方差缩减技术,参见Durham and Gallant(2002);林德斯特罗姆(2012a)。然而,对于更复杂的模型,我们不能期望能够以闭合形式求解福克-普朗克方程(5)或方程(6)中的条件期望。

地板
大多数88 在职认证  发表于 2022-5-9 05:48:44
这意味着这些近似最大似然法的复杂性在观测数量上是线性的(就昂贵的运算而言)。一种可能的补救方法是高斯-埃尔米特(Gauss-Hermite),见Ait-Sahalia(2002),或saddlepoint,见Ait-Sahalia和Yu(2006)的扩展。对于频繁采样的数据,这些方法可能非常准确,但也有重要的局限性。比如兰帕蒂变换的存在,以及k=tk- tk-1由于错误通常是OL+1kL是级数展开中的项数。一个关键的操作是对进程Yt=g(Xt)(7)进行Lamperti变换,使得zt的动力学由dyt=f(Yt)dt+dWt给出。(8) Ait-Sahalia(2002)中的跃迁概率由Hermite级数近似给出(此处假设k= 对于所有观测值)pY(yk | yk-1) = 1/2φyk- yk-1.1/2∞Xj=0ηθjHjyk- yk-1.1/2(9) 系数ηθj=j!EθHjyk- yk-1.1/2|锌-1.(10) 其中Hj是一个j阶埃尔米特多项式。值得注意的是,级数展开不会收敛于所有分布,而有限展开可能对某些值为负。后者可以通过考虑对数密度的级数展开来解决,但该级数可能不统一。尽管如此,复杂度本质上是次线性的,因为衍生展开式的主要复杂度只执行一次。一种更简单的方法是使用准最大似然估计,参见Godambe和Heyde(2010);瑟伦森(2012);Lindstrom等人(2015年)。

7
mingdashike22 在职认证  发表于 2022-5-9 05:48:48
下边是统计效率的损失,因为最大似然估计的分布如下所示:√N^θ - θD→ N(0,I)-1F),(11)其中θ是真参数,如果是定义为(IF)i,j=E的Fisher信息矩阵θiθjlog p(X |θ)(12) 或者等价地(如果)i,j=E(θilog p(X |θ))(θjlog p(X |θ))(13) 而拟极大似然估计的分布由下式给出:√N^θ - θD→ N(0,J)-1IJ-1) ,(14)式中(J)i,J=Eθi|ogθψ和(I)I,j=E((θilogψ(X |θ))(θjlogψ(X |θ))ψ是高斯密度,位置和尺度参数由条件均值和(co)方差给出。协方差总是大于或等于最大似然估计的方差(这源自CramerRao不等式),对于近似高斯模型,差异通常相当小,参见Overbeck和Ryd\'en(1997)。2.1。使用QML进行条件矩参数估计是我们开始计算随机过程条件矩的一个原因。在本节中,我们假设g(·)是一个表示任何感兴趣的条件时刻的一般函数。条件矩由θ[g(Xk)|Xk给出-1=xk]=Zg(xk)pθ(xk | xk-1) dxk,(15)式中pθ(xk | xk-1) 是条件概率密度。上一节中的讨论说明了为什么等式(15)在一般情况下难以处理,这就是为什么我们必须求助于近似。条件矩的大多数近似可以表示为加权的sumEθ[g(Xk)|Xk-1=xk]≈Xiωig(ξi)。(16) 这种近似包括蒙特卡罗估计等技术和各种确定性求积规则,如矩形规则、高斯-厄米特求积的梯形规则。也可以使用It¨o Taylor展开来近似条件期望。假设函数g是2k+1次连续可微的。

8
能者818 在职认证  发表于 2022-5-9 05:48:52
然后它认为eθ[g(Xk)|Xk-1=xk]=LXl=0Llg(xk)lkl!+O(L+1k),k=tk- tk-1.(17)注意,除非对X施加额外的约束,否则这种扩展不能保证收敛,详情见Ait-Sahalia(2002),但它通常在小时间间隔内运行良好,因为领先误差项为0(L+1k)。这类近似用于计算埃米特级数展开式中的矩,伊纳·t-Sahalia(2002)。可能有必要在一系列较小的步骤上迭代It’o-Taylor展开式关于稀疏采样数据的t/m,参见龙格-库塔和多步方法,见Kloeden和Platen(1992)。一开始提到的另一种方法是使用生成器计算条件矩。这需要我们为每一时刻解一个偏微分方程。Feynman-Kac(F-K)公式,见Karatzas和Shreve(2012),建立了条件期望和抛物偏微分方程之间的关系。具体来说,让τ∈ [tk]-1,tk]定义条件期望u(x,τ)=Eθ[g(Xk)|xτ=x](18),当动力学由式(1)给出时。然后给出期望值的解作为期望值的解τu(x,τ)=-Lu(x,τ)。(19) 在初始条件下,给定的x(y)等于g(y),其中g(y)等于g(y)。与福克-普朗克方程相比,求解伴随问题至少有两个优点。首先,对于任意数量的观测,我们只需要求解一个Pd,这应该与蒙特卡罗和求积方法的计算复杂度进行比较,其中有必要在每次观测之间计算权重和/或粒子。其次,从数值的角度来看,求解伴随方程更具鲁棒性,因为它有一个完整的初始条件(方程在时间上向后求解)。

9
能者818 在职认证  发表于 2022-5-9 05:48:54
对于标准矩,一个多项式,xp。我们稍后会证明,不管我们感兴趣的时刻有多少,它实际上足以解一个偏微分方程。这使得计算复杂度与完整的近似最大似然估计相比微不足道。我们在表1中分别对每种方法的优缺点进行了概念性总结。我们在福克-普朗克方法上做了标记(*) 因为这种方法的性能很小kdepends在前面描述的initialcondition类型中非常强。表1:不同参数估计方法的可行性。方法小 大的 小数据集大数据集Euler Maruyama Yes-Yes Yes Sit¨o-Taylor(等式(17))Yes Yes YesFokker Planck* Yes Yes Monte Carlo Yes Yes Hermite级数Yes-Yes Yes Generator(F-K)Yes Yes Yes Yes Yes Yes Yes在下一节中,我们将介绍一种从科尔莫戈罗夫向后方程计算条件矩的数值方法。3.科尔莫戈罗夫后向方程的离散化数值求解科尔莫戈罗夫后向方程可以用大量不同的方法实现。我们选择了在空间上具有中心差异的半离散化,以实现最大的简单性,并且我们将在稍后看到重用计算的可能性。倒向方程式(19)是一个复杂的问题,因为它有一个由感兴趣的条件矩u(x,T)=g(x)定义的最终条件,但缺少边界条件。这类似于许多期权定价问题,在这些问题中,通常会从解的渐近展开中施加边界条件,参见von Sydow等人(2015),了解计算期权价格的数值技术概述。为了使公式(19)适定,有必要对系数的某些值施加边界条件。

10
能者818 在职认证  发表于 2022-5-9 05:48:57
必要时的条件可以从Offhera函数(此处为一维)中找到,Fich=0,NXiaθ(xi)+xbθ(xi)κ(20),其中κ={-1,1}是边界法线。Fich时不需要边界条件≥ 费希拉(1956年)于1950年出版。例如,x=0时Cox-Ingersoll-Ross模型的Fichera条件由ab给出≥ σ/2也被称为Feller条件。假设后向方程在正Fichera意义下是适定的,没有边界条件,我们仍然需要确定半离散系统的边界值的一些条件。Ekstrom等人(2009年)建议通过求解边界处的简化后向方程来计算边界值,并在内部节点点上定义有限差分。我们在这里通过使用内部节点点在边界处求解完整方程(19)来推广这种方法。这种方法的优点是,它不需要一个大的解域,也不需要在代数系统中引入右手边向量。这使得我们能够快速计算我们将使用的解决方案的时间积分。转向内部节点导数的离散化。倒立二阶偏导数由二阶中心差近似,其中un=u(xmin+nh),h是两个节点之间的距离。然后,导数由联合国十、≈2h(联合国+1)- 联合国-1) (21)及联合国十、≈h(un+1- 2un+un-1) . (22)两种近似值的误差均为O(h)。将FD近似值(21和22)插入式(19)中,结果为:联合国τ= -aθ(xn)2h(un+1)- 联合国-1) -2hbθ(xn)(un+1)- 2un+un-1) . (23)在边界0,N处,我们需要用扭曲的有限差解方程(19)。在下边界上,我们使用以下方案:联合国十、≈ -HU- 2u+u(24)及联合国十、≈h(2u)- 5u+4u- u) 。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 03:03