楼主: 大多数88
1003 18

[量化金融] 机器学习在产量曲线特征提取中的应用 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.8997
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-11 05:47:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Machine Learning for Yield Curve Feature Extraction: Application to
  Illiquid Corporate Bonds》
---
作者:
Greg Kirczenow, Masoud Hashemi, Ali Fathi and Matt Davison
---
最新提交年份:
2018
---
英文摘要:
  This paper studies an application of machine learning in extracting features from the historical market implied corporate bond yields. We consider an example of a hypothetical illiquid fixed income market. After choosing a surrogate liquid market, we apply the Denoising Autoencoder (DAE) algorithm to learn the features of the missing yield parameters from the historical data of the instruments traded in the chosen liquid market. The DAE algorithm is then challenged by two \"point-in-time\" inpainting algorithms taken from the image processing and computer vision domain. It is observed that, when tested on unobserved rate surfaces, the DAE algorithm exhibits superior performance thanks to the features it has learned from the historical shapes of yield curves.
---
中文摘要:
本文研究了机器学习在从历史市场隐含的公司债券收益率中提取特征方面的应用。我们考虑一个假设的非流动固定收益市场的例子。在选择替代流动市场后,我们应用去噪自动编码器(DAE)算法从所选流动市场交易工具的历史数据中学习缺失收益率参数的特征。然后,DAE算法受到来自图像处理和计算机视觉领域的两种“时间点”修复算法的挑战。据观察,当在未观测到的速率曲面上进行测试时,DAE算法表现出优异的性能,这得益于它从屈服曲线的历史形状中学到的特性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Machine_Learning_for_Yield_Curve_Feature_Extraction:_Application_to_Illiquid_Cor.pdf (8.02 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 Applications fixed income Econophysics Quantitative

沙发
何人来此 在职认证  发表于 2022-6-11 05:47:10
提交给内政部的手稿:10.3934/xx。xx。xx。xxMathematics in Science and Industry卷X,编号0X,XX 200X pp.X–XX机器学习用于收益率曲线特征提取:应用于非流动性企业Bondsgreg Kirczenow*, 马苏德·哈希米*, 阿里·法蒂*和Matt DavidsonAbstract。本文研究了机器学习在从历史市场隐含的公司债券收益率中提取特征方面的应用。我们考虑了一个假设的非流动固定收益市场的例子。在选择了错误的流动市场后,我们应用去噪自动编码器(DAE)算法从所选流动市场交易的工具的历史数据中学习缺失收益率参数的特征。DAE算法受到来自图像处理和计算机视觉领域的两种“时间点”修复算法的挑战。据观察,当在未观察到的速率曲面上进行测试时,DAE算法表现出优于其从屈服曲线的历史形状中学到的特征的性能。1、简介。在许多固定收益市场中,市场流动性不足以帮助价格发现,因此,很难找到所有评级和期限对的债券收益率。因此,每天,各种评级和期限的债券收益率报价可以视为稀疏矩阵(见图1)。本论文的中心思想是设计一台无监督机器,通过观察流动市场中的大量历史例子来学习公司债券收益率曲线的显著特征,然后在非流动市场中使用所学的形状填充缺失的收益率。

藤椅
可人4 在职认证  发表于 2022-6-11 05:47:13
粗略地说,该机器是一种插值/外推工具,然而,它也包含了对典型屈服曲线形状的记忆。我们在处理这个问题时的主要见解是将稀疏yieldmatrix视为损坏的图像。因此,我们的目标是重建完整的yieldmatrix,就像从带噪图像重建图像一样。为此,我们考虑了几种已成功应用于计算机视觉中各种任务的算法,所有这些算法都属于修复算法的范畴[3、1、7]。考虑的第一种算法是denoisingautoencoder(DAE),该算法首次被提出,目的是在深度学习的预研究中更好地对图像进行深度神经网络训练(背景见[4]和[13])。为了2010年的数学学科分类,测试了几种类型的DAE体系结构。初级:58F15、58F17;次要:53C35。关键词和短语。债券收益率曲线,机器学习,自动编码器,全变量绘制,薄板样条。*本文件中表达的所有内容和观点均为作者的观点,并不代表RBC Financial Group的观点。RELU代表直线单元,它是现代深度学习体系结构中最常见的层次激活函数。2 GREG KIRCZENOW、MASOUD HASHEMI、ALI FATHI和MATT Davidsona在数据有限的情况下取得了最高的性能(见第3.5节和第4节)。本文还考虑了全变分修复(TV)和薄板样条(TPS)算法。

板凳
可人4 在职认证  发表于 2022-6-11 05:47:17
这些算法与DAE之间的一个重要区别是,以前的算法是以时间点格式进行校准的。更准确地说,DAE试图通过对历史观察进行训练来学习收益率曲线的经验特征,而TV和TPS则试图仅使用矩阵中存在的结构来填充给定的稀疏矩阵,而不需要任何历史知识。据观察,虽然三种算法在均匀稀疏屈服矩阵上的性能大致相当(见第4节),但在块稀疏的情况下,DAE表现出优异的泛化性能。本文的组织结构如下。在第2节中,解释了问题的设置。在第3节中,对DAE算法和DAE的各种网络体系结构进行了详细描述。为了完整性起见,本文介绍了TV和TPS算法的详细信息。第4节介绍了useddata和算法实现的详细信息。第5节总结了实验结果。图1:。完整/稀疏产量矩阵样本(来源:彭博社)。2、问题定义。问题设置如下所示。考虑一个固定收入者,他必须为特定市场中不同评级和期限的各种非流动性公司/主权债券提供报价。交易员只能获得评级/期限网格上几个锚定点的债券收益率,她要求根据给定的点完成评级/期限矩阵。这是市场无套利约束下的内插/外推问题。这些约束共同体现为曲线形状中的特征。例如,在正常的市场环境中,每个评级的收益率曲线都向上倾斜,长期利率高于短期利率(参见图2的示例)。

报纸
nandehutu2022 在职认证  发表于 2022-6-11 05:47:20
根据仪器的供需情况,曲线可能会显示其他特征,如驼峰和混合等。在我们的问题的典型情况下,只有一些评级的曲线短端的一些收益率是已知的。用于产量曲线特征提取的机器学习3有许多方法可用于沿极坐标插值产量曲线(有关方法的概述,请参见[5])。然而,我们感兴趣的任务是沿着评级和基调坐标填充稀疏矩阵网格,因此需要对上述方法进行二维推广。图2:。在时间点二维插值方法、TV([3]、[1])和图像处理领域的TPS算法中,可以应用一种典型的收益率曲线结构(来源:彭博社)(详见第3.1节和第3.2节)。TPS曲面[6]、[10]、[14]是一维平滑样条曲线到二维的自然推广,是填充二维网格并将其转换为曲面的有效工具,同时可以控制插值曲面的振荡行为(见下文第3.2节)。如【5】所述,样条插值器和更一般的时间点插值方法不一定会在收益率曲线中产生经验预期的特征。TV和TPS算法也是如此。因此,插值算法的原始输出必须经过额外的修改步骤,以产生所需的曲线特征(如单调性、凹度等)。我们提出的无监督方法将能够直接从其观察到的训练数据中推断标准特征(可能还有其他属性)。3、理论背景。在本节中,我们简要介绍了本文中实现的算法的理论基础。

地板
大多数88 在职认证  发表于 2022-6-11 05:47:23
我们定义了一类称为自动编码器(AEs)的无监督神经网络。我们指定了这一系列算法的子类,称为去噪自动编码器(DAE)。我们还描述了这些算法的全连接神经网络(FCNN)和卷积神经网络(CNN)结构。本文还介绍了DAE的挑战者模型theTV和TPS算法。我们请读者参阅[4],了解NNs、CNN和自动编码器的详细信息。读者可以查询[6]、[14]、[3]和[1],了解有关TV和TPS算法的更多详细信息。3.1. 总变化修复。本文的贡献是将屈服矩阵插值/外推公式化为一个图像修复问题,其目标是恢复图像中缺失的部分。修复问题通常被描述为最小化恢复误差总和的优化,以及建模矩阵argminfXikf(Xi)全局行为的正则化项- yik+λR(f)(1)4 GREG KIRCZENOW、MASOUD HASHEMI、ALI FATHI和MATT Davidsony,其中y是观测矩阵,f(X)是恢复矩阵,λ>0是正则化权重,R(f)是正则化项。考虑到图像的局部平滑度,一种非常流行的修复方法使用图像在垂直和水平方向的一阶梯度,即全变差(TV)修复:argminfXikf(Xi)- yik+λN-1Xi=0N-1Xi=0|f(X)i,j |。(2)3.2. 薄板花键。在基于TV的算法中,一个众所周知的问题是倾向于消除图像特征中的高频变化。因此,提出了其他补充算法来提高恢复图像的质量。这类基于词典学习的技术可以学习同一类图像的高频结构。

7
mingdashike22 在职认证  发表于 2022-6-11 05:47:26
然后,学习的词典将用于稀疏编码,以恢复图像中缺失的高频内容(参见[8]和其中的参考文献)。然而,通过观察评级期限表面的结构(图2),可以看出收益率矩阵具有光滑的半二次结构。这鼓励了高阶正则化的应用。在这种情况下,一种可能的选择是Hessian矩阵的平方和(即二阶微分),这种方法称为薄板样条(TPS)。TPS曲面是一维三次样条曲线的二维推广(参见[6]、[10]、[14])。TPS是网格点{(Xi,yi)}mi=1的插值算法,其中Xi=(Xi,Xi)∈ R、 样条曲面f(x,x)的构造使其尽可能靠近网格点,同时显示可控的振荡量。该偏差/方差最优曲面是通过在适当的函数空间上最小化以下actionfunctional得到的(见[14])。S【f】=Xikf(Xi)- yik+λZ | H(f)| dx。(3) 这里,| H(f)|表示f和λ的Hessian矩阵的平方项之和∈R+是正则化参数。第一项是拟合误差的度量,第二项中的积分度量插值曲面的振荡行为。TPS解决方案是上述行动的最小化。应用uler-Lagrange公式求(3)中泛函的最小值,得到解空间上具有一定正交性条件的四阶偏微分方程(见[6]、[10])。三维欧几里德空间(2D TPS)中的解由以下闭式表达式给出,f(x)=mXi=1aiG(x,Xi)+(b+bx+bx)。

8
何人来此 在职认证  发表于 2022-6-11 05:47:29
(4) 实际上,在3D情况下,可以设置G(X,s)=u(| X- s |),其中u(x)=xlog x。使用约束f(Xi)=yi,可以得到以下线性系统,Y=Ma+N b,(5)其中M是一个M×M矩阵,其条目为Mij=G(Xi,Xj),N是一个M×3矩阵,其行为[1 XTi]。该系统受正交条件机器学习的约束,用于屈服曲线特征提取5(见[10])NTa=0。结果表明,矩阵M是非奇异的,系统(5)可以通过,b=(NTM)来求解-1N)-1 NTM-1Y,(6)a=M-1(Y- N b)。(7) 必须提前设置正则化权重λ。实际上,λ是通过超参数调整过程选择的,例如k-折叠交叉验证(见[6]和[11])。3.3. 自动编码器。参考文献[4]和[13]提供了神经网络的基础知识,我们密切关注它们的概念和符号。自动编码器可以描述为一类无监督学习算法,旨在通过某种(非线性)再现过程将输入转换为输出。它们被称为无监督的,因为算法只使用输入X进行学习。自动编码器转换输入向量x∈ Rdto隐藏表示h(x)∈ Rdvia映射h(x)=g(W x+b)(参见下图3)。W是一个d×d权重矩阵,b称为偏差向量。映射g(.)也称为自动编码器的编码器部分。然后,算法的解码器部分将获得的隐藏表示映射回重构向量z∈ Rdvia映射z=k(W*h(x)+c)。图3:。通用自动编码器架构。因此,观察值xi首先映射到相应的h(xi),然后映射到toa重建zi。如果我们定义θ={W,b}和θ={W*, c} ,通过求解argmin{θ,θ}NNXi=1L(xi,zi)找到最佳权重。(8) 这里,L(x,z)是一个选择的损失函数。

9
nandehutu2022 在职认证  发表于 2022-6-11 05:47:32
统计学习中密度估计的主要方法[12]可以指导我们选择成本函数来训练自动编码器。通常,首先选择数据p(x |θ)的联合分布,其中θ是分布参数的向量。接下来,我们定义了GREG KIRCZENOW、MASOUD HASHEMI、ALI FATHI和MATT Davidsonθ和h(x)之间的关系,并建立了损失函数L(ko g(x))=- 对数p(x,θ),其中ko g(x)=z是自动编码器函数形式。例如,选择平方误差损失L(x,z)=kx- zk等价于选择平均值为θ的阿高辛分布和数据的单位协方差矩阵,p(x,θ)=2πN/2exp(-NXi=1(xi- θi)),(9),其中θ=c+W*h(x)(见【4】)。3.4. 去噪自动编码器。如上所述,自动编码器的基本思想是最小化预期损失函数E[L(x,ko g(x)]。这里,lossfunction惩罚函数k的相异性o g(x)来自x。这可能导致函数形式仅仅是一个身份映射ko g(x)=x,如果算法架构允许的话。换句话说,如果自动编码器的隐藏层h(x)比输入向量(overcomplete)宽,那么算法只会将输入复制到隐藏层,因此不会学习输入的有意义特征。为了避免这种情况,可以训练去噪自动编码器(DAE)。(本节紧跟[13]中的论述;有关更多详细信息,请参见[4]和其中的参考文献。)其思想是最小化预期损失E[L(x,ko g(▄x))]其中▄x是x的异常版本。

10
能者818 在职认证  发表于 2022-6-11 05:47:35
因此,DAE必须学习功能,以便保存损坏版本中的原始数据,而不是简单地复制其输入。该过程首先将噪声(掩蔽)注入初始输入x,通过随机过程(so,x)获得部分损坏的拷贝x~ qD(¢x | x)。在【13】中,执行了以下损坏过程:对于每个输入x,坐标的执行比例ν(预先固定)随机设置为0,而其他坐标保持不变。然后将输入▄x的损坏副本送入常规自动编码器(见图4)。重要的是要注意,模型的参数被训练为最小化平均重建误差E[L(x,z)],而不是E[L(x,z)],即获得尽可能接近未损坏输入x的z。这里,输出z与x而不是x.3.5确定相关。自动编码器的体系结构。自动编码器的编码器和解码器部分是具有可变结构的前馈神经网络(定义和详细信息参见[13])。上图4展示了本文中DAE的完全连接神经网络(FCNN)(见第4.4节)。从图中可以看出,输入经过编码器过滤后生成代码。然后解码器根据代码重建输出。图4所示的解码器架构是编码器的镜像,这不是一个要求,而是一种流行的架构选择。唯一的要求是输入空间的尺寸,输出空间必须是匹配的。正如[9]中所强调的,用于自动编码器和DAE的FCNN体系结构都忽略了图像的二维结构(在我们的情况下,评级/主题曲面的二维结构)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 15:53