楼主: 何人来此
1214 33

[量化金融] 非同步财务数据的Copula估计 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-14 13:22:55
当i=1(1)n时,校正系数仅为tk和tk的函数,即它仅取决于到达过程,而不取决于copula。2.3. 非线性依赖与椭圆copula。到目前为止,我们通过相关系数来处理线性相关性。在本节中,我们将通过copula处理非线性相关。我们将把注意力限制在椭圆copula上。Gaussiancopula是应用最广泛的椭圆copula,它模仿了多变量高斯分布的依赖结构。但它并没有捕捉到非线性依赖。众所周知,相关系数为零的高斯copula退化为独立copula。但总的来说,情况并非如此。例如,对于另一个常见的椭圆copula,即t copula,参数捕捉线性依赖关系,但copula函数的形式适应非线性依赖关系。现在我们将讨论非同步性对copula估计的影响。根据Sklar定理(见Nelsen(2007)),对数返回的分布函数Rand Rcan可以表示为F(r,r)=C(F(r),F(r);θ) ,其中C是与F关联的唯一copula。异步性不仅影响θ的估计,而且还影响copula函数的估计,因为rand-lever假设是同步观测的。^C(^F(r),^F(r)的收敛性;^θ),其中^F(.)和^F(.)是F(.)的经验分布函数和F(.),需要的不仅仅是^θ的收敛。下一个定理试图解决这个问题。在说明该定理之前,我们将做一个额外的假设,确保在长度为2δ的区间内,Tkia处的缺失收益值和tkilying处的观测收益值的概率在ψ>0时为δnψ的顺序。

12
何人来此 在职认证  发表于 2022-6-14 13:22:59
定义,Rt(kli)=Xt(kli)- Xt(kli)和Rt(kli)=Yt(kli)- Yt(kli),l=1,2。A: P[| Rlt(ki)- Rlt(ki)|≤ 2δ]=O(δnψ),对于l=1,2,其中|δ|=| maxi(rt(ki)- rt(ki))|<mw,ψ>0,M为正实数。定理2。如果真正的底层copula是椭圆copula,那么在- A、 C(^F(r),~F(r);^θ)一致收敛于真copula,其中^F(.)和▄F(.)是根据成对数据计算出的Rand R边缘的经验分布函数,^θ定义如定理1所示。附录A.2.4给出了定理2的证明。数据和γ的预期损失:回想一下,定理1中的修正系数只是到达过程的函数。用到达过程的基本参数来表示γ是值得的。在下一个定理中,我们将尝试这样做。但这个定理的含义超出了这个目的。请记住,我们讨论的所有同步方法都有一个问题。这会导致数据丢失,从图2可以明显看出这一点。第一批库存的第二次观察将不包括在任何一对中,因此将被浪费。因此,我们可以问这样一个问题:使用我们的配对方法(A),会浪费(每只股票)多大比例的观察结果。如果我们可以比较一只股票的平均到达间隔长度(例如E(ti- ti公司-1) 对于Firststock)和成对形成的平均间隔长度(E(tki-tki公司-1) 对于第一批股票)。这里需要注意的一个重要点是,即使两个初始点过程ti:i=1(1)和ti:i=1(1)是独立的,配对观测tki:i=1(1)n和tki:i=1(1)n后的点过程也不是独立的。这是因为Pairing方法(A)涉及两种库存的到达。

13
mingdashike22 在职认证  发表于 2022-6-14 13:23:02
由于这个事实,我们将在下一个定理中看到E(tki-tki公司-1) 和E(tki-tki公司-1) 涉及λ,λ,两点过程的参数。定理3。假设两个基本点过程是参数为λ、λ和Zk的泊松过程~ β(1,k)对于k>1,则,(a)E(I)=P∞n=1n[(λ+λ)(pn+qn)](b)E(tki- tki公司-1) =ηλ(c)E(tki- tki公司-1) =ηλ,其中pn=FZn+1(λλ+λ)- FZn(λ+λ),qn=FZn+1(λ+λ)- FZn(λλ+λ),对于i=1,2ηi=∞Xk=1[{FB(1,k+1)(1-λiλ+λ)-FB(1,k)(1-λiλ+λ)}+k{FB(1,k+1)(λiλ+λ)-FB(1,k)(λiλ+λ)}]定理3的证明见附录A。根据该定理,我们得到γ=qηηλλP∞n=1n[(λ+λ)(pn+qn)](2)3。一般copula的扩展在本节中,我们将讨论一类更一般的copula。由于第2节中的论点完全基于相关系数,因此不能直接推广到更大类别的copula。这正是因为对于一般copula,皮尔逊相关系数与copula参数之间没有直接关系。我们建议使用Kendall的Tau来捕捉copula依赖。肯德尔τ的定义是ρτ(X,Y):=E(符号((X-X)(Y-Y))),其中▄X和▄Y是X和Y的相同但独立的副本。Nkendall的Tau和copula之间的关系可以通过下面的方程得到。ρτ(X,Y)=4ZZC(u,u)dC(u,u)- 1.(3)如果X和Y是由φin生成的阿基米德copula C的随机变量Ohm 那么ρτ(X,Y)=1+4Zφ(t)φ(t)dt。(4) 对于椭圆copula,可以导出一个简化形式,ρτ(X,Y)=π弧inρ。(5) 因此,我们可以研究肯德尔的τ如何受到异步性的影响。因此,我们将使用上述关系来衡量对copula参数的影响。3.1. 低估Kendall的tau。非同步数据的问题是,任何两个独立的返回对都不能被视为彼此的相同副本。

14
何人来此 在职认证  发表于 2022-6-14 13:23:05
要看到这一点,请考虑图6,其中第一个库存的到达时间用三角形表示,第二个库存的到达时间用圆圈表示。应用配对方法后,假设第一个圆和第一个三角形代表第一对价格的位置。同样,第二个圆和第二个三角形代表下一对。从图中可以明显看出,这两对构成了第二种配置的示例(见等式1)。同样,第3对和第4对构成第4种配置的示例。因此,相应的回报可能不会被视为具有相同的分布。在本小节中,我们将仅使用具有相同配置的回报来衡量Kendall的τ。图7表示两对相同配置的到达时间。图6:。两个不同配置的两个独立观察(对)。图7:。如图7所示,两对具有相同配置的到达时间的示例,假设我们有两个非重叠的到达间隔UAN和UF用于第一个库存和+ u+η和+ u+η表示第二个库存,到达时间分别由三角形和圆形表示。与第一批库存的相互到达相对应的日志返回由R=R(u)和R=R(u)给出。类似地,对应于第二个股票区间的对数收益用R=R表示(+ u+η)=R() + R(u)+R(η)(由于独立增量特性)和R=R(+ u+η)=R() + R(u)+R(η)。在下一节中,我们将重点讨论两种具体配置(公式(1))。定义,A=(R(I)- R(I))(R(I)- R(I))和B=(R(I)- R(I))(R(Ic)- 第四种配置的R(Ic)(R(Ic)- R(Ic))(R(I)- R(I))用于第一个配置,其中iI和ICI分别是第I对回路的重叠区域和非重叠区域。在上述示例中,长度(I)=u,长度(I)=u,长度(Ic)=+ η和长度(Ic)=+ η.

15
能者818 在职认证  发表于 2022-6-14 13:23:08
请注意,对于第一个和第四个配置,E(符号(A))给出了真实的肯德尔τ。我们无法计算E(符号(A)),因为R(I)和R(I)是不可观测的。相反,我们观察R(I∪Ic)和R(I∪Ic)。因此,观察到的Kendall\'sTau为E(符号(A+B))。在本节中,我们将尝试找出E(符号(A))和E(符号(A+B))之间的关系。为了建立我们的结果,我们需要一些假设。假设X和Y是正相关的随机变量。设(X,Y)和(X,Y)是(X,Y)的两个相同副本。然后,根据Y- Y> 0,我们预计X- Xis更可能是积极的而不是消极的。直觉上,正关联还表明,给定信息Y- Y∈ S R+,X- Xis更可能是积极的。这一概念通常不会被任何已知的关联度量所捕获。对于以下各项,我们将(X,Y)和(X,Y)定义为(X,Y)的两个相同副本,U=X- X和V=Y- Y、 假设(B)如下所述,尝试捕捉上述想法:B:如果P(U V>0)- P(UV<0)>0(或<0),然后对于所有M>0,P(U>0 | 0<V<M)- P(U<0 | 0<V<M)≥ 0(或<0)和P(V>0 | 0<U<M)-P(V<0 | 0<U<M)≥ 0(或<0)。B: 如果P(U V>0)- P(UV<0)>0(或<0),然后对于所有M>0,P(UV>0 | | V |>M)- P(U V<0 | | V |>M)>0(或>0)和P(UV>0 | | V |>M)- P(U V<0 | | U |>M)>0(或>0)。在陈述主要定理之前,我们将首先陈述一些有助于证明定理的引理。引理1。E(符号(A)|符号(A)6=符号(B))=E(符号(A))。引理1的证明见附录A。引理2。E(符号(A)|符号(A)6=符号(B),| A |<B |)=E(符号(A)| A |<B |)这是引理1和{符号(A)6=符号(B)}和{A |<B}的独立性的直接结果。定理4。

16
nandehutu2022 在职认证  发表于 2022-6-14 13:23:11
在假设B下,对于具有第1和第4配置的成对,ρτ>ρτ,其中ρτ是根据具有第1和第4配置的成对数据计算的肯德尔τ,即ρτ=e(符号(X- 十) (Y)- Y) ,其中(X,Y)和(X,Y)是相同配置的独立对。定理4的证明在附录A中给出。现在我们将证明符号(ρτ)=符号(^ρτ)。定理5。对于具有第一和第四配置的成对,ρτ=E符号(A |符号(A)6=符号(B)&| A |>| B |)P(| A |>| B |),其中ρτ是根据配对数据和第1和第4配置计算的肯德尔τ,即ρτ=e(符号(X- 十) (Y)- Y) ,其中(X,Y)和(X,Y)是相同配置的独立对。定理5的证明见附录A。引理2,ρτ=E标志(A | | A |>B |)P(| A |>| B |)。这与假设B一起意味着,符号(ρτ)=符号(^ρτ)。定理4和5共同表明,在图8的假设下,配对观测到的异步数据后得到的Kendallτ的估计量低估了真实参数。从100次高斯copula模拟(左)获得的真实与平均估计相关性,以及从100次Clayton copula模拟(右)获得的真实与平均估计Kendallτ。两种情况下的边缘均为高斯分布,平均值为0,标准偏差为1。第1次和第4次配置。在其他两种配置下也可以得出类似的结果。3.2. 修正估计量。与第2节类似,我们想为更一般的copula类找到一个仅取决于到达时间的修正系数。对于椭圆copula,校正因子的值不依赖于参数的值。这从图8(左面板)可以明显看出,图8显示了模拟非同步数据的高斯copula的真实和未修正平均估计参数。我们根据预先规定的泊松过程生成到达时间。

17
kedemingshi 在职认证  发表于 2022-6-14 13:23:14
我们可以看到,真实参数和估计参数位于回归线沿线,其中回归线的截距项不显著。这表明修正后的估计量应该是未修正估计量的常数倍。该常数是定理1中导出的修正系数。另一方面,在Clayton copula的图(右图8)中,我们可以看到,直线不是模拟真实和未校正的估计Kendallτ之间关系的好选择。这意味着我们不应该期望找到一个简单的乘法校正因子,它将为我们提供真实参数的值。经检验,二次多项式似乎是一个很好的模型。在相同的过程中,二次多项式似乎也适用于Gumbel copula。因此,我们使用二次模型来获得修正的估计量。具体步骤如下:(1)根据观测数据,独立估计两个到达过程。(2) 估计单变量边际分布。(3) 使用第2.2节中描述的配对算法,配对观测值。(4) 通过配对数据,我们现在可以看到哪个copula最适合数据。它可以通过AIC或BIC准则获得。(5) 根据该配对数据估计Kendall\'s tau(未校正)。(6) Pre fix K copula参数(或相当于Kendall的tau)。对于每个参数,利用基本copula、到达过程和边缘信息,我们现在模拟N个非同步样本(生成非同步数据的技术在第4节中讨论)。(7) 对于每个样本,计算未修正估计值,并将估计值和trueKendall\'s tau绘制在图中,如图所示。

18
大多数88 在职认证  发表于 2022-6-14 13:23:17
10(右面板)。(8) 为这样的图拟合合适的二次回归。(9) 从回归方程中,找出与Kendall\'s tau估计值相对应的修正Kendall\'s tau(从步骤5获得)。注意,上述过程通过考虑回归中的预测区间,得出了Kendallτ的区间估计量。在第4节中,我们通过仿真研究了这些区间的覆盖概率,并将其与其他区间估计进行了比较。4、模拟我们模拟了n+n个时间点两支股票的同步对数收益率数据。时间点由泊松过程生成。相应的n+n收益率随机从由预先指定的copula和边距确定的二元分布中提取。然后对这些n+NPAIR进行适当转换,以表示相应区间的原木价格。现在,从第一只股票中,我们随机删除ntime点及其相应的价格。剩余的淹没点构成了第一个股票的数据。对于第二个库存,我们保留从第一个库存中删除的时间点,并删除其余时间点。这些时间点及其对应的原木价格构成了第二只股票的数据。现在我们有两支股票的非同步数据。4.1. 椭圆copula的copula参数估计。在下面的模拟研究中,我们测试了定理1中规定的方法的性能,以估计种群参数。为此,我们首先选择一个高斯copula,并通过上述方法生成100个非同步数据实例。最初,nand和NAR都是一样的。表1和表2中报告了100个估计值的平均值、方差和均方误差。在图9中,我们显示了ρ=0.8的箱线图。

19
能者818 在职认证  发表于 2022-6-14 13:23:21
左侧的箱线图对应于校正后的估计值,中间和右侧的箱线图对应于从刷新时间采样和之前的勾选采样中获得的未校正估计值。水平线表示真实参数。从表中,我们可以看到,之前的勾号和刷新时间采样都无法捕获真实依赖性的大小。事实上,前面的tick方法是最差的同步选择。我们对t copula进行了相同的分析,不同的边际分布具有不同的自由度,这是一种更现实的日内财务数据情景。结果是相似的,即我们规定的修正不仅给出了一个很好的估计,而且未修正的方法返回了一个有偏差的估计,偏差是显著的。表3总结了参数为0.4的100次模拟结果。ρn估计值来自修正前蜱虫采样刷新时间采样估计值-0.4 800-0.2316-0.2680-0.4022(0.049)(0.046)(0.069)0.1 800 0.061 0.069 0.1049(0.043)(0.042)(0.063)0.2 800 0.1205 0.1237 0.1853(0.049)(0.067)0.8 800 0.4675 0.5255 0.7885(0.035)(0.051)-0.4 2000-0.2325-0.2682-0.4022(0.034)(0.025)(0.039)0.1 2000 0.056 0.065 0.098(0.033)(0.026)(0.039)0.2 2000 0.1115 0.1274 0.1911(0.027)(0.031)(0.046)0.8 2000 0.4613 0.5258 0.7888(0.028)(0.019)(0.029)-0.4 5000-0.2289-0.2637-0.3956(0.018)(0.017)(0.026)0.1 5000-0.061 0.065 0.099(0.049)(0.029)0.2 5000 0.1165 0.1355 7 0.2036(0.019)(0.015)(0.023)0.8 5000 0.4582 0.5224 0.7844(0.016)(0.013)(0.019)表1。不同ρ和样本量的100次模拟估计的平均值和标准偏差。

20
何人来此 在职认证  发表于 2022-6-14 13:23:24
报告了本章规定的标准(未修正)估计量(具有先前的勾号和刷新时间同步)和修正估计量。ρn MSE(上一个刻度)MSE(刷新时间)MSE(校正)-0.4 800 0.0307 0.0195 0.00470.2 800 0.0087 0.0078 0.00470.8 800 0.112 0.0765 0.0027-0.4 2000 0.029 0.0179 0.00150.2 2000 0.0085 0.0062 0.00210.8 2000 0.1155 0.0755 0.0009-0.4 5000 0.0296 0.018 0.00060.2 5000 0.007 0.004 0.00030.8 5000 0.0 1117 0.077 0.0006表2。表1中结果的计算均方误差。图9:。ρ=0.25(左)和ρ=0.8(右)的箱线图;第一个箱线图用于校正样本量为2000的100个模拟的估计值。中间和最后的曲线图分别对应于刷新时间采样和先前蜱虫采样的估计值。t copula(df 8)mean-sd-mean-sdmarginals未修正估计未修正估计修正估计修正估计(t(5),t(7))-0.2623 0.036-0.3932 0.054(N(0,2),N(0,4))-0.264 0.038-0.3961 0.055(t(4),N(0,3))-0.2532 0.039-0.3801 0.059表3。ρ=-0.4. 报告了刷新时间采样的标准未修正估计值和修正估计值。4.2. 非椭圆copula中Kendallτ的区间估计:我们采用三种方法对真Kendallτ进行区间估计,并将其应用于多个阿基米德copula的模拟数据。在第一种方法中,我们遵循上述方法,得到95%的预测区间。图10右面板中的蓝色虚线显示了Clayton copula的预测区间。第二种方法与第一种方法相似,但我们没有确定回归线。相反,对于每个真实的Kendall\'s tau,我们绘制了包含(低估)Kendall\'stau 95%时间的区间。在图的左面板中。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-2 05:10