楼主: 大多数88
940 20

[量化金融] 离散系统的零膨胀自回归条件持续时间模型 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.7797
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-23 19:48:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Zero-Inflated Autoregressive Conditional Duration Model for Discrete
  Trade Durations with Excessive Zeros》
---
作者:
Francisco Blasques, Vladim\\\'ir Hol\\\'y and Petra Tomanov\\\'a
---
最新提交年份:
2020
---
英文摘要:
  In finance, durations between successive transactions are usually modeled by the autoregressive conditional duration model based on a continuous distribution omitting zero values. Zero or close-to-zero durations can be caused by either split transactions or independent transactions. We propose a discrete model allowing for excessive zero values based on the zero-inflated negative binomial distribution with score dynamics. This model allows to distinguish between the processes generating split and standard transactions. We use the existing theory on score models to establish the invertibility of the score filter and verify that sufficient conditions hold for the consistency and asymptotic normality of the maximum likelihood of the model parameters. In an empirical study of DJIA stocks, we find that split transactions cause on average 63% of close-to-zero values. Furthermore, the loss of decimal places in the proposed approach is less severe than incorrect treatment of close-to-zero values in continuous models.
---
中文摘要:
在金融学中,连续交易之间的持续时间通常由基于忽略零值的连续分布的自回归条件持续时间模型建模。拆分交易或独立交易都可能导致零或接近零的持续时间。我们提出了一个基于分数动态零膨胀负二项分布的离散模型,允许过多的零值。此模型允许区分生成拆分事务和标准事务的流程。我们利用已有的评分模型理论建立评分滤波器的可逆性,并验证模型参数的最大似然一致性和渐近正态性的充分条件。在对道琼斯工业平均指数股票的实证研究中,我们发现分割交易平均导致63%的接近零值。此外,与在连续模型中对接近零值的错误处理相比,所提出的方法中小数点的丢失不那么严重。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--

---
PDF下载:
--> Zero-Inflated_Autoregressive_Conditional_Duration_Model_for_Discrete_Trade_Durat.pdf (753.44 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:持续时间 自回归 Transactions distribution Quantitative

沙发
可人4 在职认证  发表于 2022-6-23 19:48:17
零波动自回归条件持续时间模型,用于离散交易持续时间过多的零Francisco BlasquesVU University Amsterdam和Tinbergen InstituteDe Boelelaan 1105,NL-1081HV Amsterdam,The Netherlandsf。blasques@vu.nlVladim里尔·霍尔(Hol'yPrague University of Economics and BusinessWinston Churchill Square,1938/4,130 67 Prague 3,Czechiavladimir)。holy@vse.czPetra托马诺夫á布拉格经济和商业大学温斯顿·丘吉尔广场1938/4,130 67布拉格3号,捷克。tomanova@vse.czAbstract:在金融中,连续交易之间的持续时间通常由基于忽略零值的连续分布的自回归条件持续时间模型建模。零或接近零的持续时间可能由拆分事务或独立事务引起。我们提出了一个离散模型,该模型基于分数动态的零负指数分布,允许过多的零值。此模型允许区分生成拆分的流程和标准事务。我们使用评分模型的现有理论来建立评分滤波器的可逆性,并验证模型参数的最大似然的一致性和共正态性的充分条件。在一项实证研究中,我们发现分割交易导致92%至98%的零值和接近零值。此外,与连续模型中零值的不正确处理相比,所提出方法中小数点的丢失不太严重。关键词:金融高频数据、自回归条件持续时间模型、零负二项分布、广义自回归得分模型。JEL代码:C22、C41、C58.1简介财务高频数据分析的一个重要方面是对不同事件之间的持续时间进行建模。

藤椅
可人4 在职认证  发表于 2022-6-23 19:48:21
这些包括交易记录时间(交易持续时间)、价格按给定水平变化的时间(价格持续时间)和交易量达到给定水平的时间(交易持续时间)。财务持续时间表现出很强的序列相关性,即长持续时间之后通常是长持续时间,短持续时间之后是短持续时间。为了捕捉这种时间依赖性,Engle和Russell(1998)提出了自回归条件持续时间(ACD)模型。自这篇开创性的论文以来,各种连续分布被用于工期建模;有关概述,请参阅表1。ACD模型类似于GARCH波动率模型,在财务期限领域也同样受欢迎。有关工期分析的调查,请参见Pacurar(2008)、Bauwens和Hautsch(2009)、Hautsch(2012)以及Saranjeet和Ramanathan(2018)。我们关注交易持续时间及其一个特殊的经验特征——零持续时间的频繁发生,即同时执行的交易。零持续时间通常被认为是由所谓的分割交易造成的,即大交易分成两个或多个小交易(参见Pacurar,2008)。随后,合并具有相同时间戳的观测值,并将所得价格计算为按体积加权的价格平均值。从贸易持续时间的时间序列来看,零值被简单地丢弃了。这种方法有一个明显的问题,即只在同一时间发生但并非来自同一来源的无关交易也可能被合并,并且其零持续时间被丢弃。尽管如此,这是恩格尔和罗素(1998)在ACD文献中最常见的方法。

板凳
可人4 在职认证  发表于 2022-6-23 19:48:24
对于基于分布的ACD模型来说,处理零值甚至是必要的,这些分布的支持中不包含零;与表1中列出的所有分布一样,指数分布除外。或者,Bauwens(2006)建议将零持续时间设置为一个较小的给定值,而不是丢弃它们。这种转换允许保持数据集中的所有观测值,但这是非常任意的,并且会扭曲接近零的持续时间分布。然而,从经济角度来看,将分割交易视为一项单一交易是有意义的(参见Grammig andWellner,2002)。有关零持续时间的信息也可用于分析。Zhang等人(2001年)将多项交易指标作为解释变量纳入其ACD模型。Veredaset al.(2002)注意到,许多同时发生的交易都是以整数价格进行的,这表明许多贸易商都会以整数价格执行限额订单——这是一种经验现象,称为价格聚类(参见Hol'y和Tomanová的文献综述,2021)。最近,Liuet al.(2018)研究了零持续时间对综合波动率估计的影响。Engle和Russell(1998)等人在千年之交分析的数据集具有精确到1秒的时间戳。如今,一些交易所的交易记录标准是精确到一毫秒、一微秒甚至一纳秒。这种高细节会导致另一个问题–拆分事务不必同时发生。表2给出了轶事证据。Grammig和Wellner(2002)已经认识到这一点,他们将一秒钟内价格不变或不变的连续交易视为一个大型交易。

报纸
mingdashike22 在职认证  发表于 2022-6-23 19:48:27
让我们仔细看看最近的一个数据集,其中包括在泛欧交易所、纽约证券交易所和纳斯达克交易所交易的6只股票,从汤森路透数据库获得的精度为1毫秒。图1显示了Parzen–Rosenblatt窗口法估计的持续时间对数密度。此图中省略了完全等于零的值。原木持续时间的密度集中在两个区域,即地块中部的“小山”和地块左侧的“波浪”。“波形”是由数据的离散性造成的,捕获的持续时间接近于零。最左侧的峰值对应于0.001秒,最右侧的峰值对应于0.002秒,依此类推。为了提高这些接近零的持续时间的可读性,图2显示了它们在数据中的出现。首先,我们可以看到,零持续时间占单个股票所有持续时间的43%到67%。等于0.001的持续时间也相当频繁,占5%到8%。等于0.002的持续时间约占2%,等于0.003的持续时间约占1%。其他描述性统计数据见表3。这里的主要信息是,图1和图2表明,持续时间由两个过程生成——一个过程生成与不相关交易相对应的分散值,另一个过程生成与拆分交易相对应的零或接近零的值。因此,假设所有拆分事务的持续时间都为零,并且所有零持续时间都对应于拆分事务的传统方法并不太合适。首先,如上所述,放弃所有零持续时间可能也会放弃对应于不相关事务的零持续时间。其次,也是更重要的一点,保持所有正持续时间可能也会使分割事务对应的持续时间接近于零。

地板
可人4 在职认证  发表于 2022-6-23 19:48:30
丢弃所有零和无正数值会导致由于接近零的值的不准确表示而导致分布失真。我们建议通过分别生成不相关和拆分事务的两个进程的混合来建模持续时间。我们通过将数值四舍五入到百分之一秒(即厘米秒)来降低持续时间的精度,并在离散的框架内操作。在这种精度降低的情况下,我们假设与拆分交易相对应的所有接近零的持续时间都归为一组新的零持续时间,即其原始值低于0.01秒。然后,我们采用Lambert(1992)的零膨胀分布对持续时间进行建模。此分布假定一个进程生成大于或等于零的整数值,而另一个进程只生成零值。持续时间为零的非相关交易的概率则由正值分布决定,而分割交易的概率则由表1:ACD模型中连续分布的使用决定。文章分布参数Sengle和Russell(1998)指数1angle和Russell(1998)Weibull 2Lunde(1999)广义Gamma 3Grammig和Maurer(2000)Burr 3Hautsch(2005)广义F 4Bhatti(2010)Birnbaum–Saunders 2Xu(2013)对数正态2Leiva et al.(2014)幂指数B–S 3Leiva et al.(2014)Student’S t B–S 3Zheng et al.(2016)Fréchet 2给出了零持续时间通过零膨胀分布的膨胀参数。因此,我们能够估计不相关交易和分割交易之间的比率。

7
能者818 在职认证  发表于 2022-6-23 19:48:33
在实证研究中,我们证明,我们模型的简单性及其适应无关交易和分割交易的能力弥补了持续时间准确性的损失。鉴于上述讨论,我们在本文中提出了一个新的零膨胀自回归条件持续时间(ZIACD)模型。我们的模型基于负二项分布,以适应持续时间内的过度分散(见Boswell和Patil,1970;Cameron和Trivedi,1986;Christouand Fokianos,2014)。分割交易导致的过度零持续时间由负二项分布的零膨胀修正得到(见Greene,1994)。我们让分布的尺度、离散度和波动参数随时间变化,并遵循广义自回归评分(GAS)模型的动力学,也称为动态条件评分模型(seeCreal et al.,2013;Harvey,2013)。在GAS框架中,时变参数取决于其滞后值和条件观测密度的标度分数。GAS模型属于Cox(1981)定义的观测驱动模型,因此具有其优点,例如,观测驱动模型可以通过最大似然法以简单的方式进行估计,并且其参数在过去的信息下是完全可预测的。此外,Blasqueset al.(2015)研究了预测可能性得分函数的信息论最优性特性,并表明只有基于得分的参数更新才能始终减少真实条件密度和模型隐含条件密度之间的局部Kullback–Leibler差异。Koopman等人。

8
mingdashike22 在职认证  发表于 2022-6-23 19:48:36
(2016)发现基于分数的观察驱动模型在预测准确性方面与参数驱动模型具有可比性。在本文中,我们建立了ZIACD模型中气体过滤器的可逆性,以及时变尺度参数、静态色散和零漂移参数情况下最大似然估计的一致性和渐近正态性。在股票市场的实证研究中,我们证明了所提出的持续时间四舍五入到百分之一秒的ZIACD模型在实践中是可用的,并且优于不正确处理零值的连续模型。论文的其余部分结构如下。在第2节中,我们提出了基于零负二项分布的ZIACD模型。在第三节中,我们验证了时变尺度情况下最大似然估计的渐近性质。在第4节中,我们描述了财务持续时间数据的特征,将拟议的ZIACD模型置于离散框架内,并将其与连续模型进行比较。在第5节中,我们讨论了将拟议的ZIACD模型用于低精度数据和替代混合ACD模型作为未来研究的主题。我们在第6.2节中总结了零膨胀ACD模型T≤ T≤ ··· ≤ Tnbe表示交易时间的随机变量。交易持续时间定义为Xi=Ti- Ti公司-1对于i=1,n

9
大多数88 在职认证  发表于 2022-6-23 19:48:40
由于我们在一个离散的框架中运作,我们假设表2:摘自2012年6月21日MSFT股票的限额订单簿。消息时间顺序ID事件方向大小价格09:30:01.146 16333185提交购买300美元30.99。。。09:30:01.370 163333185执行买入100美元30.9909:30:01.377 163333185执行买入200美元30.99。。。09:30:03.550 16576783提交出售3000美元30.99。。。09:30:03.553 16576783执行卖出400美元30.9909:30:03.555 16576783执行卖出400美元30.9909:30:03.555 16576783执行卖出300美元30.9909:30:03.627 16576783删除卖出1900美元30.990.000.250.500.751.00-8.-4 0 4 8log(持续时间)估计密度StockEuronext:INGAEURONEXT:ASMLNYSE:MCDNYSE:IBMNASDAQ:CSCONASDAQ:Msf正持续时间对数的无条件密度图1:2021 6月使用高斯核估计对数持续时间的密度函数。不包括零持续时间。●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.000.250.500.751.000.000 0.002 0.004 0.006 0.008 0.01工期估计概率库存●●●泛欧交易所:INGAURONEXT:ASMLNYSE:MCDNYSE:IBMNASDAQ:CSCONASDAQ:MSFT无条件成交概率-到-零持续时间图2:2021 6月,持续时间在0到0.01秒之间的概率。Ti公司∈ N、 i=0,n和Xi∈ N、 i=1,n、 我们进一步假设交易持续时间Xito遵循给定的离散分布,条件概率质量函数P[Xi=Xi |θ],其中夏尔观测值和θ=(θ,…,θl)是参数。首先,我们考虑交易持续时间服从负二项分布。接下来,我们将负二项分布扩展到使用零溢出模型捕获过多的零。

10
nandehutu2022 在职认证  发表于 2022-6-23 19:48:43
最后,我们利用广义自回归得分动力学使参数是时变的。2.1负二项分布非负整数变量通常使用基于特定分布的计数数据模型进行分析,最显著的是泊松分布和负二项分布(见Cameron和Trivedi,2013)。泊松分布的一个显著特征是其期望值等于其方差。这一特性在许多应用程序中过于严格,因为计数数据过度分散,方差高于预期值。克服这一限制的泊松分布的推广是负二项分布,其中一个参数决定其期望值,另一个参数决定其过度分散。负二项(NB)分布可以通过多种方式推导出来(见Boswell和Patil,1970)。我们使用Cameron和Trivedi(1986)的NB2参数化,该参数化源自Poissongamma混合分布。根据Cameron和Trivedi(2013),这是负二项回归中最常用的参数化。标度参数u>0和色散参数α的概率质量函数≥ 0 isP[Xi=Xi |u,α]=Γ(Xi+α-1) Γ(xi+1)Γ(α-1)α-1α-1+ uα-1.uα-1+ uxi对于xi=0,1,2。(1) 期望值和方差isE【Xi】=u,var【Xi】=u(1+αu)。(2) 负二项分布的特殊情况包括α=0的泊松分布和α=1的几何分布。请注意,此假设没有限制性,因为持续时间自然是离散的且非负的。因此,当按下与时间戳精度相对应的单位时(例如秒、毫秒、。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 02:46