楼主: kedemingshi
444 14

[量化金融] 屈服曲线参数的联合概率分布建模 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
85.5799
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24962 点
帖子
4219
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Modeling joint probability distribution of yield curve parameters》
---
作者:
Jarek Duda, Ma{\\l}gorzata Snarska
---
最新提交年份:
2018
---
英文摘要:
  US Yield curve has recently collapsed to its most flattened level since subprime crisis and is close to the inversion. This fact has gathered attention of investors around the world and revived the discussion of proper modeling and forecasting yield curve, since changes in interest rate structure are believed to represent investors expectations about the future state of economy and have foreshadowed recessions in the United States. While changes in term structure of interest rates are relatively easy to interpret they are however very difficult to model and forecast due to no proper economic theory underlying such events. Yield curves are usually represented by multivariate sparse time series, at any point in time infinite dimensional curve is portrayed via relatively few points in a multivariate space of data and as a consequence multimodal statistical dependencies behind these curves are relatively hard to extract and forecast via typical multivariate statistical methods.We propose to model yield curves via reconstruction of joint probability distribution of parameters in functional space as a high degree polynomial. Thanks to adoption of an orthonormal basis, the MSE estimation of coefficients of a given function is an average over a data sample in the space of functions. Since such polynomial coefficients are independent and have cumulant-like interpretation ie.describe corresponding perturbation from an uniform joint distribution, our approach can also be extended to any d-dimensional space of yield curve parameters (also in neighboring times) due to controllable accuracy. We believe that this approach to modeling of local behavior of a sparse multivariate curved time series can complement prediction from standard models like ARIMA, that are using long range dependencies, but provide only inaccurate prediction of probability distribution, often as just Gaussian with constant width.
---
中文摘要:
美国收益率曲线最近已跌至次贷危机以来最平坦的水平,接近反转。这一事实引起了世界各地投资者的关注,并重新引发了对正确建模和预测收益率曲线的讨论,因为利率结构的变化被认为代表了投资者对未来经济状况的预期,并预示着美国的衰退。虽然利率期限结构的变化相对容易解释,但由于此类事件背后没有合适的经济理论,因此很难对其进行建模和预测。收益率曲线通常由多元稀疏时间序列表示,在任何时间点,通过多元数据空间中相对较少的点来描绘无限维曲线,因此,这些曲线背后的多模态统计相关性相对难以通过典型的多元统计方法提取和预测。我们建议通过将函数空间中参数的联合概率分布重建为高次多项式来建模屈服曲线。由于采用了正交基,给定函数系数的均方误差估计是函数空间中数据样本的平均值。由于这些多项式系数是独立的,并且具有类似累积量的解释,即描述来自均匀联合分布的相应扰动,由于精度可控,我们的方法也可以扩展到屈服曲线参数的任何d维空间(也在相邻时间)。我们相信,这种对稀疏多元曲线时间序列的局部行为建模的方法可以补充ARIMA等标准模型的预测,这些模型使用长距离依赖关系,但只能提供不准确的概率分布预测,通常就像等宽高斯分布一样。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--

---
PDF下载:
--> Modeling_joint_probability_distribution_of_yield_curve_parameters.pdf (1.29 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:概率分布 Multivariate distribution coefficients Applications

沙发
mingdashike22 在职认证  发表于 2022-6-10 08:34:49 |只看作者 |坛友微信交流群
产量曲线参数的联合概率分布建模AREK DudaMalgorzata SnarskaJagiellonian大学,波兰克拉科夫24号,31-007,电子邮件:dudajar@gmail.comCracow波兰克拉科夫拉科维卡经济大学金融与法律学院27号,31-510,电子邮箱:snarskam@uek.krakow.plAbstract-美国收益率曲线最近已跌至次贷危机以来的最低点,接近反转。这一事实引起了全世界投资者的关注,并重新引发了对正确建模和预测收益率曲线的讨论,因为利率结构的变化被认为代表了投资者对未来经济状况的预期,从这个意义上说,这预示着美国每一次衰退。虽然利率期限结构的变化相对容易解释,但由于没有正确的经济理论来解释这些事件,因此很难对其进行建模和预测。收益率曲线通常由多变量但非常稀疏的时间序列表示,即在任何时间点,有限维曲线通过多变量数据空间中相对较少的点来描述,因此,这些曲线背后的多模态统计相关性相对难以通过典型的多变量统计方法提取和预测。我们建议通过将函数空间中参数的联合概率分布重构为高次多项式来建模屈服曲线。由于采用了正交基,给定函数效率的MSE估计仅为函数空间中adata样本的平均值。因为这些多项式系数是独立的,并且具有累积量式的解释:即。

使用道具

藤椅
可人4 在职认证  发表于 2022-6-10 08:34:52 |只看作者 |坛友微信交流群
它们描述了来自非均匀联合分布的相应扰动,由于精度可控,我们的方法也可以扩展到屈服曲线参数的任何d维空间(也可以扩展到八次)。我们相信,这种对稀疏多变量曲线时间序列的局部行为建模的方法可以补充ARIMA等标准模型的预测,这些模型使用的是长程依赖,但只能提供概率分布的不准确预测,通常就像高斯等长分布一样。关键词:时间序列分析、机器学习、密度估计、产量曲线建模。一、 简介由于成功预测财务时间序列通常可以转化为利润,因此很难对以下值进行比前一值更好的预测。然而,上述市场自我监管机制并不限制对价值概率分布的预测,这对于风险评估或蒙特卡罗模拟来说至关重要。预测值概率分布的标准方法(如ARIMA)通常将此分布建模为高斯分布,通常宽度恒定:预测某些值及其不准确度(标准偏差)。相比之下,我们将使用大量独立系数对这种概率分布进行建模,这些系数将联合分布描述为多项式分布-结果导致与标准假设的高斯分布非常不同和更复杂的分布-例如讨论的示例中的多峰分布。具体而言,由于很难获得比前一个值更好的预测,我们将重点关注两个后续值之间的差异顺序。

使用道具

板凳
大多数88 在职认证  发表于 2022-6-10 08:34:56 |只看作者 |坛友微信交流群
在讨论的例子中,它将是Diebold-Li模型屈服曲线参数的三维空间[?](对于固定λ=0.0609),可以通过操作时间窗口进一步增加维度以改进预测:使用以前的一些值作为预测的背景。为了便于拟合多项式,我们将首先将每个变量标准化为[0,1]上的近似均匀分布。这可以通过使用该变量近似分布的CDF(累积概率分布)转换变量来实现,对于该变量,我们将使用拉普拉斯分布,因为它与经验CDF(图2)很好地一致,取d此类规范化变量,例如,对于给定时间或相邻时间内的不同参数,如果不相关,它们将来自几乎一致的ρ≈ 1分布在[0,1]d上。我们将用正交多项式ρ(x)=Pjajfj(x)的线性组合来模拟这种一致密度的扰动。这使得MSE最优估计非常昂贵[2]:aj=| X | Px∈Xfj(x)只是平均过样本x。不同j的系数是独立的,具有多变量累积量样的特殊解释,可用于描述被测变量之间的统计相关性。本文将一维变量的方法论(以道琼斯工业平均指数时间序列为例)扩展到多维随机变量的情况。二、近似均匀密度归一化我们将讨论6470(1993年至2018年)日收益率曲线β,β,β参数{β,β,β}t=1的时间序列示例。。n=6470。时间序列通常是标准化的,例如,允许平稳过程的假设:这样,接合概率分布在移动位置时不会改变。标准方法,尤其是高斯分布,是减去平均值,然后除以图1。对每个变量进行归一化,使其在[0,1]范围内具有几乎均匀的ρ=1密度(PDF)。

使用道具

报纸
能者818 在职认证  发表于 2022-6-10 08:34:59 |只看作者 |坛友微信交流群
顶部:由于利用了联合分布,观测值的排序预测ρ通常比基础ρ=1高得多。四个图对应于所有三个变量或所有变量的9次多项式构造的参数的联合分布。令人惊讶的是,我们发现(x,x)比这里的所有3个变量都能给出更好的预测。底部:所有3个变量的预测ρ>2的区域。从上面的曲线图中,我们可以看出观察值在其中≈ 62%的病例。与通常假设的高斯分布不同,从实际数据得到的分布在这里是多峰的。密度聚焦(x,x)的对角表示它们是反相关的。标准偏差。然而,这种规范化并没有挖掘我们感兴趣的值之间的局部依赖关系。因此,我们将研究从当前值到基于先前值的预测值之间的差异序列(误差、残差),例如ARIMA类模型。为了简单起见,我们将在这里使用前一个值作为预测值:对βi(t+1)进行运算- t=1的βi(t)序列。n其中n=n- 在实际应用中,βi(t)可以用更复杂的预测器代替,例如利用长范围依赖性。如图2所示,这些序列与图2不同。左:6470的时间序列(1993年至2018年)每日收益率曲线β,β,β参数(Diebold-Li模型[?])使用λ=0.0609标准假设进行拟合。我们将研究xi(t):=CDFLaplace(ui,bi)(βi(t+1)- βi(t))时间序列:在[0,1]上的归一化tonearly均匀分布。

使用道具

地板
kedemingshi 在职认证  发表于 2022-6-10 08:35:01 |只看作者 |坛友微信交流群
右图:将从排序值获得的经验LCDF与拉普拉斯分布和高斯分布的CDF与估计参数进行比较-我们将使用拉普拉斯,因为它具有更好的一致性。预测值具有近似拉普拉斯分布:g(y)=2bexp-|y- u| b(1) 其中,参数的最大似然估计为:u=y的中值,b=y的平均值- u|.为了简单起见,我们在这里使用拉普拉斯分布来规范化变量,使其在[0,1]中几乎一致,并为不同的变量使用分离参数:xi(t):=Gi(βi(t+1)- βi(t))(2),其中G(y)=Ry-∞g(y)Dy是所用分布的CDF(此处为拉普拉斯)。我们将搜索ρX(X)密度。为了去除转换(1)以检索(β,β,β)的最终密度,观察P(y=G-1(x)≤ y) =P(x≤ G(y))。对y进行微分,得到ρy(y)=ρX(G(y))·G(y)。三、 层次相关重构归一化后,我们有{x(t),x(t),x(t)}时间序列,独立变量的密度几乎一致。取其d值:作为不同的坐标或时间邻域,如果不相关,它们将来自[0,1]d中的近似均匀分布-与均匀分布的差异描述了我们时间序列中的统计依赖性。我们将使用多项式来描述这种差异:估计x的d个相邻值的联合密度。假设{xt}t=1,。。。,n [0,1]d相邻值的向量序列(我们将在后面讨论各种可能性),我们想对图3的密度进行建模。顶部:使用的一维正交多项式基(hf,gi=Rfg dx)的前6个:j=0系数保护归一化,其余函数积分为0,其系数描述均匀分布的扰动。这些系数与累积量具有相似的解释,但更便于重建密度。底部:2D产品基准fj(x)=fj(x)fj(x),对于m=2:j∈ {0, 1, 2}.

使用道具

7
可人4 在职认证  发表于 2022-6-10 08:35:05 |只看作者 |坛友微信交流群
j=0坐标不会修改相应的变量-通常给定的系数描述具有非零指数的坐标之间的统计相关性。例如多项式向量。结果表明[2],使用正交基,对于多维情况,正交基可以是一维正交多项式的乘积,均方(MSE,L)优化可以得到非常简单的估计系数公式:ρ(x)=Xj∈{0,m}dajfj(x)=mXj。。。jd=0ajfj(x)··fjd(xd),估计系数:aj=nnXt=1fj(xt)(3)以这种方式使用的基础具有| B |=(m+1)d函数。除了廉价的计算外,这种简单的方法还具有系数独立的非常方便的特性,为每个j提供了唯一的值和解释。独立性还允许考虑基础的灵活性,而不是考虑所有j,我们可以关注更有前景的基础:例如,效率的绝对值更大,取代可忽略的aj。代替MSE优化,我们可以使用通常首选的:似然最大化[3],但它需要额外的迭代优化,并引入系数之间的依赖关系。上述fj1D多项式在[0,1]中是正交的:Rfj(x)fk(x)dx=δjk,获取(重新缩放Legendre):f=1,对于j=1,2,3,4,5,相应地:√3(2x-1),√5(6倍-6倍+1),√7(20倍-30倍+12倍-1) ,3(70倍- 140倍+90倍- 20倍+1),√11(252x- 630x+560x- 210倍+30倍-1).它们绘制在图3的顶部。F对应于规范化。j=1系数决定减少或增加平均值-具有与预期值类似的解释。类似地,j=2关于聚焦或传播给定变量的系数,类似于方差。

使用道具

8
nandehutu2022 在职认证  发表于 2022-6-10 08:35:08 |只看作者 |坛友微信交流群
等等:进一步的FJ与累积量有类似的解释,然而,虽然从矩重建密度是一个困难的矩问题,但给出的描述是直接估计密度的多项式系数。对于多变量,AJ只描述了C={i:ji>0}坐标之间的相关性,不影响ji=0坐标,如图3底部所示。每个系数在这里也有特定的解释,例如,决定第二个变量的增加和减少与第一个变量的增加之间的关系,分析决定第二个变量的重点或范围。此类估计系数的误差来自近似高斯分布:~aj- aj公司~ N0,√nsZ(fj- aj)ρdx!(4) 对于ρ=1,积分值为1,得到σ=1/√n≈在我们的情况下为0.013。如图4所示,这里的许多系数要大十倍以上:可以认为是必要的,而不是噪声的结果。四、 上下文无关建模我们将类似于马尔可夫建模:基于一个或几个以前的值建模新值的概率分布,称为预测上下文。与标准的马尔可夫情形相反,我们使用的值是连续的:从这里的[0,1]或[0,1]或[0,1]。为预测考虑的先前值的数量称为模型顺序。0阶或无上下文模型值作为独立的随机变量:都来自相同的概率密度。顺序1是标准的Markovprocess:使用上下文作为前一个值来建模当前值的概率分布。类似地,对于高阶模型:使用一些以前的值作为预测的上下文。让我们从基本的无上下文方法开始:只模拟观察值的联合分布,而不是寻找与相邻值的统计依赖关系。在讨论中,例如d=3维,对于t=1,xt=(x(t),x(t),x(t))。

使用道具

9
可人4 在职认证  发表于 2022-6-10 08:35:11 |只看作者 |坛友微信交流群
n=n。我们也可以只使用这些变量的子集,例如,对于d=2,我们这里有三个可能的对:(x,x),(x,x)和(x,x)。由于使用了归一化,减小到d=1应导致密度几乎均匀。例如,用于此目的的假设拉普拉斯分布的缺陷将得到纠正,同时在多维情况下,通过j系数拟合多项式,ji=0,但对于所有给定坐标。图1顶部包含拟合m=9次多项式(每个变量)的评估和4种情况:d=3图4。建模(x,x,x)变量的联合概率分布,每个变量在[0,1]上归一化为近似均匀分布。左上角:作为密度估计得到的最大正系数和负系数ajof多项式:对应于[0,1]上均匀分布的ajfj(x)fj(x)fj(x)校正。其余3个区域图显示了所有3对变量的实际值(6469个小黑点)和获得密度的区域图,m=9次多项式,表示其联合分布的不均匀性,尤其是(x,x)对(右上角)。如果这些变量不相关(ρ≈ 1) ,一个区域的概率将与其面积成正比。相反,此处的蓝色区域对应于估计的密度1≤ ρ ≤ 2的面积超过1/2,但仅≈ 概率的18%,主要集中在对角线的边缘附近。从最大系数中可以看出:负110表示反相关,正220表示极值概率增加。第三个变量在系数表中出现得更远,这意味着统计相关性较弱。所有3对d=2。它显示了实际观测值预测的排序ρ-它越高,预测越好。

使用道具

10
nandehutu2022 在职认证  发表于 2022-6-10 08:35:15 |只看作者 |坛友微信交流群
除了所使用的模型外,此类预测的效率还强烈依赖于这些变量之间的客观统计依赖性,例如,如果它们不相关,则将失败。令人惊讶的是,我们可以从该图中看到,仅使用前两个变量比所有三个变量的预测效果更好——第三个变量的相关性较弱,与x(红色图)的相关性比与x(绿色图)的相关性更强。这种评估预测的图也允许校准密度图,包括对负密度的解释是所提出方法的伪影:我们可以看到≈ 3%的病例密度为负,因此ρ>0区域预计表示≈ 97%的病例。类似地,我们可以解释这些图的更多行,例如,我们可以看到图1中的蓝色和橙色线的ρ>2 in≈ 62%的病例。Lower3D密度图显示了[0,1]中的ρ>2区域,其中仅包含≈ 体积的14%,不相关变量的概率是多少,它包含更多:≈ 样本分数的62%。图4显示了所有3对等距ρ的多条等值线的2D区域,也可以将其作为3D密度的边缘化获得。它能更好地显示x和x之间的强统计依赖性,而x的统计依赖性则弱得多。百分比表示在给定区域观察到病例的概率,例如,对于浅蓝色区域,0<ρ<1。丢失概率局限于其他区域。Tinyblack点是实际的6469个数据点-presenteddensity region图MSE fit degree m=9多项式对样本所有点的Dirac Delta之和。图4还包含最大的正系数(左,通常从1开始表示归一化)和负系数(右)。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-25 04:53