楼主: 大多数88
2162 55

[量化金融] 多协变量点过程预测的估计 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.8997
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-5-31 04:36:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Estimation for the Prediction of Point Processes with Many Covariates》
---
作者:
Alessio Sancetta
---
最新提交年份:
2017
---
英文摘要:
  Estimation of the intensity of a point process is considered within a nonparametric framework. The intensity measure is unknown and depends on covariates, possibly many more than the observed number of jumps. Only a single trajectory of the counting process is observed. Interest lies in estimating the intensity conditional on the covariates. The impact of the covariates is modelled by an additive model where each component can be written as a linear combination of possibly unknown functions. The focus is on prediction as opposed to variable screening. Conditions are imposed on the coefficients of this linear combination in order to control the estimation error. The rates of convergence are optimal when the number of active covariates is large. As an application, the intensity of the buy and sell trades of the New Zealand dollar futures is estimated and a test for forecast evaluation is presented. A simulation is included to provide some finite sample intuition on the model and asymptotic properties.
---
中文摘要:
在非参数框架内考虑点过程强度的估计。强度度量未知,取决于协变量,可能比观察到的跳跃次数多得多。只观察到计数过程的单一轨迹。兴趣在于估计以协变量为条件的强度。协变量的影响由一个相加模型建模,其中每个分量都可以写成可能未知函数的线性组合。重点是预测,而不是变量筛选。对该线性组合的系数施加条件以控制估计误差。当活动协变量数目较大时,收敛速度最优。作为一个应用,估计了新西兰元期货买卖交易的强度,并给出了预测评估测试。包括一个模拟,以提供一些关于模型和渐近性质的有限样本直觉。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
--> Estimation_for_the_Prediction_of_Point_Processes_with_Many_Covariates.pdf (468.41 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:点过程 协变量 coefficients Quantitative Multivariate

沙发
能者818 在职认证  发表于 2022-5-31 04:36:24
用manycoveonatesalsio-Sancetta预测点过程的估计*2017年2月20日抽象在非参数框架内考虑点过程强度的估计。强度度量是未知的,并且取决于协变量,可能比观察到的跳跃数还要多。只观察到计数过程的单一轨迹。兴趣在于估计以协变量为条件的强度。协变量的影响由一个加性模型建模,其中每个分量都可以写成可能未知函数的线性组合。重点是预测,而不是可变筛选。对这种线性组合的系数施加条件,以控制估计误差。当活动协变量数目较大时,收敛速度最快。作为一个应用,估计了新西兰元期货买卖交易的强度,并提出了一个预测价值测试。包括模拟,以提供一些关于模型和渐近性质的有限样本直觉。关键词:考克斯过程;计数过程;维度诅咒;预测评估;贪婪算法;霍克斯流程,高频交易;鞅;贸易抵达;变量选择。JEL代码:C13;C 32;C55.1引言支持您要估计并预测某些金融工具交易到达的可能性,这些金融工具的交易相对频繁。这样做的原因可能是做市或最优执行;这些问题在金融业中很常见。例如,在这里要考虑的一个应用中,工具是新西兰元的未来。

藤椅
kedemingshi 在职认证  发表于 2022-5-31 04:36:26
此类票据的贸易抵达可能取决于*致谢:我要感谢联合编辑、裁判员和卢卡·穆西安特的评论,这些评论在内容和演示方面都带来了实质性的改进。电子邮件:<asancetta@gmail.com>,URL:<http://sites.google.com/site/wwwsancetta/>。通信地址:英国伦敦皇家霍洛威大学经济系,Egham TW20 0EX。订单簿,包含5个级别的投标和报价。它还可能取决于其他相关工具的适用性、过去的价格和报价量动态以及过去的交易。即使对于高频数据,可能的协变量数量也可能快速增长并变得相对较大。将贸易到达视为计数过程的跳跃,其强度(在一个很小的时间段内的平均值)取决于一组协变量,可以解决上述问题。本文针对数据为时间序列、协变量数量大、强度函数形式不需要参数化的问题,考虑了这种计数过程的估计。Let(N(t))t≥0be对于任何Borel集a,强度测度∧(a)=^Aexp{g(X(t))}dt,(1)的计数过程 [0,∞), 其中,gis是一个未知函数,X(t)是K维变量,可以依赖于t。在(1)中的强度被理解为平均值↓0Pr(N(t+s)- N(t)=1 | Ft)s=exp{g(X(t))},其中fti是由(N(s),X(s))s生成的sigma代数≤t、 考虑到协变量与时间相关,强度可能取决于N(t)最后一次跳跃所经过的时间。协变量是可预测的,例如,自适应的左连续过程。

板凳
mingdashike22 在职认证  发表于 2022-5-31 04:36:31
如果在协变量X上设置条件,则过程为泊松过程,则计数过程通常称为asCox或双随机过程。确定停止时间Ti:=inf{s>0:N(s)≥ i} ,T=0,即T是泵的时间。在本文要考虑的实证金融微观结构应用中,跳跃时间Ti是特定证券的ithtrade到达时间,协变量将是从订单簿中提取的信息,以及其他数量。统计问题是在时间t之前观察(N(t),X(t))的问题。根据s打顶时间的定义,等到T=T意味着观察到n次跳跃。目标是估计g。已知该函数只存在于某类加性函数中,将在适当的时候介绍。协变量和跳跃之间的持续时间应该是平稳的,但既不是独立的,也不是马尔可夫的。文献中以前没有讨论过这样的时间序列问题,即只观察到一条过程轨迹,而gin(1)可能是非线性的,并且协变量的数量很大。该框架允许我们处理协变数指数大于样本量(T=Tn时为n)的超高维问题。卵巢可能是时间序列和滞后变量。这一设置受到许多应用问题的推动,例如前面提到的交易到达估计问题(例如,Bauwensand Hautsch,2009年,用于调查和参考适用于金融的计数模型)。加密仪器可能取决于其他仪器的更新和信息。这导致可能的变量数量激增,尽管人们可能认为只有少数变量可能是相关的,或者许多协变量可以解释强度,但重要性程度在降低。

报纸
mingdashike22 在职认证  发表于 2022-5-31 04:36:34
在第4节中的建模应用程序中,有一种情况下,最终得到了1000多个变量,交易数量n约为1000。本研究的主要技术特点是:1。gin(1)的估计,当Gis只存在于一些大的函数集中时;2、协变量的数量允许大于观测持续时间n的数量;3、定义了一类可加函数,并表明在这类函数中,可以获得在高维情况下最优的收敛速度;4、估计问题可用Frank-Wolfe算法求解,并给出了收敛速度;5、一项实证研究提供了该方法的适用性,并对计数模型之间的预测优势进行了检验,结果表明,适当约束的大型模型在样本外表现更好。从理论角度来看,对加法模型中线性系数(系数的形式)的绝对可和性施加了限制。这种套索约束倾向于生成稀疏的模型。这意味着,如果所有系数都不为零,但很小,那么收紧约束会导致许多变量为零,而少数变量为非零。另一方面,众所周知,收紧系数平方的约束(即岭回归中的lnorm)会导致所有系数都很小,但没有一个系数为零。从实证角度来看,pap er考虑了新西兰元期货合约上买卖交易到达强度的估计。强度使用许多与持续时间数量相同数量级的协变量进行建模。文献中考虑了买卖订单强度的估计(如Hall和Hautsch 2007)。

地板
可人4 在职认证  发表于 2022-5-31 04:36:37
然而,似乎没有任何研究考虑交易工具以及其他相关工具的市场信息(如订单)。抽样结果表明,其他仪器提供的信息是相关的。为了评估竞争模型的无样本性能,使用了基于似然比的无样本测试。有关正文中的证明和推导的详细信息,请参阅补充材料。1.1与文献的关系在回归背景下,文献中考虑了高维加性建模(例如,Bühlmann和van de Geer,2011年,以及其中的参考文献)。本文似乎是第一个考虑多协变量的估计,考虑到时间序列背景下的非线性链接函数。在这里,时间序列意味着在未来扩展的窗口上只观察到该过程的一个实现。该框架不同于Ofcx比例风险模型和Aalen乘法和加法模型。在这种情况下,不同的作者考虑了许多变量的估计(例如,Bradic等人,2011年,Gai ffas和Guilloux,2012年等)。在那里,重点通常是恢复活动变量的真实子集。这通常导致对协变量设计和交叉依赖的严格限制。在这里,重点是预测和弱条件,即使不可忽略的协变量数量随着样本规模的增加而增加,也会导致一致性。此外,除了可加性之外,这里考虑的估计是非常一般的。第3.6节概述了应用程序。

7
可人4 在职认证  发表于 2022-5-31 04:36:40
其中包括线性模型、具有协变量的霍克斯过程、阈值模型和加性单调函数等。强度函数估计量的分析通常依赖于鞅方法(Andersen和Gill,1982,van de Geer,1995)。在固定数量的协变量背景下,非参数估计量并不少见(例如,Nielsen和Linton,1995年,Fan等人,1997年,是早期参考)。这里导出的结果适用于参数函数以及某些非参数函数类。在金融计量经济学文献中,人们的兴趣通常在于单点过程的参数建模(例如,Bauwens和Hautsch,2009年的调查)。因此,本文将时间序列问题视为金融计量经济学文献中的问题,但允许可能的非参数估计和高维统计中的大量协变量。在时间序列背景下,强度通常由霍克斯过程建模。松散峰值,强度可以写成持续时间的可预测函数(例如,Bauwensand Hautsch,2009)。本文的框架允许对上述变量进行处理。1.2似然估计众所周知(例如,Brémaud,1981年,第二章,定理16),即{∧((Ti-1,Ti)):i∈ N} (如(1)中的∧)是i.i.d.指数分布,当我们条件为∧时,平均值为1。从这里可以得出可能性,即∧具有关于勒贝格测度的密度λ(例如,Ogata,1978,公式1.3)。定义人口对数likeliho odL(g):=Eg(X(0))exp{g(X(0))}- E exp{g(X(0))},(2)假设预期已明确(见补充材料A.1.2节)。支持gin(1)位于一组G中,暂时假定为可数,以避免分散技术注意力。然后,g=arg supg∈GL(g)使用对数似然的凹度。

8
nandehutu2022 在职认证  发表于 2022-5-31 04:36:43
鉴于预期未知,上述内容被经验估计值gT:=arg sup LT(g)所取代,其中sup是在下一节中定义的某类函数上,抽样可能性isLT(g):=^Tg(X(t))dN(t)-^Texp{g(X(t))}dt,(3)式中,L(g)=limTLT(g)/t几乎可以肯定(关于此陈述的证明,请参见补充材料中的A.1.2节)。假设等待直到时间Tn,使得N(Tn)=N,则可以将上述内容写入ltn(g):=nXi=1“g(X(Ti))-^TiTi-1exp{g(X(t))}dt#。最后显示中的表示对于实际计算很有用,。1.3文件大纲文件计划如下。第2节定义了估计员的模型,并说明了本文的目标。第3节说明了一致性结果及其最优性。讨论了Agreedy算法作为一种在实际中进行估计的方法。第3.6节显示了主要结果对各种估计问题的应用,并推导了收敛率。还提供了其他详细信息。例如,建议使用基于似然比的样本外测试进行预测评估。第4节将估算程序应用于买卖交易的强度。第5节提供了一些足够的证据,以便更好地理解不同参数在估计中的作用。第6节包含更多备注。补充材料第A.1节提供了结果证明。2该模型的目标是允许简单解释协变量对强度的影响。通过让g(x)在x中是线性的,可以获得很好的可解释性。然而,每个协变量的影响可能是非线性的。例如,非线性在许多应用中都有记录,例如高频金融数据(例如,Hasbrouck,1991,Lillo等人,2003)。

9
大多数88 在职认证  发表于 2022-5-31 04:36:46
这些非线性是否会影响强度取决于应用。可加非线性模型被认为是解释性和非线性关系可能性之间的合理权衡。在这种情况下,g(x)=PKk=1g(k)(x),其中g(k)是一些有界函数,可能为零,对于每个k,g(k)(x)仅取决于xk,x的k坐标=(x,x,…,xk)(即滥用符号,g(k)(x)=g(k)(xk))。这是为了减轻符号负担。2.1加法函数的表示为了控制估计误差,有必要对加法函数所在的集合施加某种结构。具有以下结构的函数被视为dg(k)(x)=xθ∈Θkbθθ(x)(4),其中Θkis是一组仅依赖于xk的函数,Θkis是可能不可数的s et,bθ是实值系数。考虑到Θkcan是不可数的,上述表示比标准级数展开更一般。总和被理解为xθ∈Θkbθ:=sup(Xθ∈Fbθ:H Θk,他的名字)。例如,我们可以有gk=bθθf或一些θ∈ Θk,其中Θkis是一个模型,可能在有限维中。由于g的加性结构,g(x)=KXk=1Xθ∈Θkbθ(x), (5) 其中,括号中的术语仅为(4)中的g(k),这是一个仅依赖于kthcovinate的函数。这种结构适合估计。在此框架内的估计需要选择bθ和θ。出于实际目的,后者可能是简单的参数函数或固定函数,而不是一般的有限维模型。详情和示例推迟到第3.6节。感兴趣的读者可以浏览f部分或概述。为了施加一般限制,假设用户确定一组权重W:={Wθ∈ (0,∞) : θ∈ Θ},其中Θ:=SKk=1Θk。

10
mingdashike22 在职认证  发表于 2022-5-31 04:36:49
这意味着对于kthexplanative变量的每个函数θ,权重wθ可以不同。那么,定义L(B)=L(B,Θ,W):=Pθ∈Θbθ:Pθ∈Θwθ| bθ|≤ B、 wθ∈ W. 这是(5)中函数的子集,因此系数的加权绝对和以某个有限常数B>0为界。权重通常用于控制每个θ的重要性。例如,可以让wθ=V ar(θ(X(t)),这样,直观地说,所有函数都具有相同的重要性。在Lasso估计中,回归系数加权绝对和的界很常见(例如,Bühlmann和van de Geer,2011)。示例1让g(x)=PKk=1bkXkandπkbe映射,使得πkx=xkf对于任何x∈ Rk和xkis是x中的k元素。然后,k:={πk}包含一个mapsx的函数∈ Rk进入其kthco坐标xk。同样,当θ∈ Θkand Xkis X的kthco坐标。约束isPKk=1 | bk | pV ar(Xk(0))≤ B、 在其他情况下,重量可用于每个功能fk内的收缩,这在有限尺寸空间中很重要。示例2为了避免分心符号,假设g(x)=P∞j=1bjxjk,一个依赖于xk的多项式∈ 仅限[0,1]。也假设P∞j=1(j!)|北京|≤ B、 因此权重迫使系数比j!衰减得更快!。一个所有阶导数均以一为界的有限可微函数可以写成上面的多项式,其中| bj |≤ (j!)-因此,权重考虑到了这一点,由于可加性约束,该约束会导致系数产生额外的收缩效应。从现在起,在编写L(B)时,对Θ和W的依赖将是隐式的。L(B)中函数对某些B的逼近误差<∞ 可以与系数的绝对值上的界有关。如果假设g∈ L(B)表示未知但有限的B。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 01:43