楼主: 可人4
703 17

[量化金融] 提出了一个方法论框架和实验指南,以 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.1043
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-5-10 11:54:38 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《A proposal of a methodological framework with experimental guidelines to
  investigate clustering stability on financial time series》
---
作者:
Gautier Marti, Philippe Very, Philippe Donnat, Frank Nielsen
---
最新提交年份:
2015
---
英文摘要:
  We present in this paper an empirical framework motivated by the practitioner point of view on stability. The goal is to both assess clustering validity and yield market insights by providing through the data perturbations we propose a multi-view of the assets\' clustering behaviour. The perturbation framework is illustrated on an extensive credit default swap time series database available online at www.datagrapple.com.
---
中文摘要:
在本文中,我们提出了一个基于实践者稳定性观点的实证框架。我们的目标是通过提供数据扰动来评估聚类有效性和产生市场洞察力,我们提出了资产聚类行为的多视角。扰动框架在www.datagrapple上提供的一个广泛的信用违约掉期时间序列数据库中进行了说明。通用域名格式。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--

---
PDF下载:
--> A_proposal_of_a_methodological_framework_with_experimental_guidelines_to_investi.pdf (1.38 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:实验指南 方法论 Applications Perturbation Practitioner

沙发
何人来此 在职认证  发表于 2022-5-10 11:54:43
提出了一个方法论框架和实验指南,以研究金融时间序列上的集群稳定性Gautier Marti、Philippe VeryPhilippe DonnatHellebore Capital Management 63 Avenue des Champs’Elys’ees FirstName。lastname@helleborecapital.comFrank尼尔森劳工学院理工学院,FRANCEnielsen@lix.polytechnique.frAbstract-在本文中,我们提出了一个基于实践者稳定性观点的实证框架。通过数据扰动,我们提出了资产集群行为的多视角,以评估集群有效性和产生市场洞察力为目标。扰动框架在www.datagrapple上提供的一个广泛的信用违约掉期时间序列数据库中进行了说明。通用域名格式。I.引言聚类,即对一组对象进行分组,使同一组中的对象(也称为聚类)比不同组中的对象更相似,这还不是财务时间序列分析的常用工具。然而,它的应用领域似乎很广:投资组合多元化[1]和风险分析,统计套利等投资策略。这种无监督的机器学习技术有几个缺点,在被金融界采用之前必须解决这些缺点。这些算法充当黑匣子,其性质如一致性,即给定算法输出的目标聚类收敛到1的可能性,以及在财务上重要的渐近区域(即随机矩阵理论渐近性[2])中的收敛速度通常未知,高维中等样本量渐近性(HDMS)和高维低样本量渐近性(HDLSS)[3]。

藤椅
何人来此 在职认证  发表于 2022-5-10 11:54:47
除了目前缺乏这些理论性质之外,当应用于金融时间序列[4],[5]时,从一种算法到另一种算法得到的聚类结果也有很大不同。更糟糕的是,在给定样本中加入小噪声,并对原始样本及其受干扰的版本应用相同的算法,会产生不同的聚类。这些当前的缺陷阻碍了基于集群的稳健应用在金融领域的应用,因为数据是对潜在现象的嘈杂观测。例如,基于集群事件的交易策略,如集群的出现、组合、分裂和衰退[6],[7],如果这些事件纯粹是由于算法不稳定而发生,则会受到影响。关于研究对象,即信用违约掉期(CDS),它们是普通的信用衍生品(参见[8]介绍衍生品,以及[9]全面处理信用衍生品和CDS数学模型),其目的是将信用风险从一个交易对手转移到另一个交易对手。它们可能被视为针对基础实体(通常是公司、金融或主权实体)违约(或ISDA合同明确规定的其他信用事件)的保险。因此,这种保险的价格可以被视为反映市场对实体违约风险担忧的一个衡量标准:风险越高,获得保险的价格就越高。CDS市场(作为场外交易(OTC)市场)被指责缺乏透明度,今天仍然难以收集该市场的公共信息。我们可以提到DTCC,它每周报告一次交易量,以及DataGrapple,它显示从2006年到现在的700个实体的历史价格时间序列,每天更新一次。A.

板凳
nandehutu2022 在职认证  发表于 2022-5-10 11:54:50
金融时间序列的相关工作聚类主要在物理学[1]、[10]、[11]中进行探索,在物理学中,它被认为是随机矩阵理论(RMT)[2]、[12]过滤相关矩阵的一种竞争方式。人们注意到(例如,在[5]中),聚类算法可以大致恢复工业分类基准(ICB)。作者建议将这些算法与ICB进行基准测试,并使用调整后的兰德指数(ARI)测量结果聚类与chosenICB之间的相似性。他们认为这一指标代表了通过方法过滤的信息,因此认为这是一种通过选择得分最高的聚类方法来进行模型选择的方法。然而,集群等统计分析可能会产生产业分类中可能不存在的集群:例如,欧洲债务危机期间的PIIGS集群(来自葡萄牙、爱尔兰、意大利、希腊和西班牙的资产)。在[5]中,作者还使用bootstrapping[13]来评估他们的聚类算法的鲁棒性,使用聚类稳定性[14]的直观但无意义的区域,即当数据受到轻微干扰时,聚类的再现性。模型选择或有效性评估的聚类稳定性[15]的确是机器学习文献中的一个热门话题:[16]警告不要使用它,因为对于大样本,稳定性只取决于聚类目标函数最小值的唯一性,然而[17]主张该标准在有限可能的小样本情况下仍然有用。从定量分析或交易者的角度来看,模型的动态稳定性,即流式数据引起的在线扰动的稳定性,是使用它们的必要条件。

报纸
大多数88 在职认证  发表于 2022-5-10 11:54:53
只有当市场上发生有意义的事件时,集群才会发生变化。尽管对从业者来说这是一个重要的概念,但很少有工作涉及基于金融时间序列计算的集群的动态稳定性特性[18]。聚类CD在文献中没有得到广泛的研究,因为数据很少且难以获得。[19] 调查研究人员和政策制定者使用的主要数据源的差异,得出信用违约掉期数据库不平等的结论。其中一些数据库是使用假设价格建立的,假设价格是根据收集到的平均数据得出的,但可能无法在此基础上进行交易。我们将使用DataGrapple的数据库,该数据库是由许多市场经销商逐个构建的。这使得我们能够在交易结束时对经销商的价格进行最佳出价/最佳报价的综合订单,从而提高交易在交易结束时可以有效地在这个水平上完成的信心。贡献我们提出了一个实证框架,以调查金融时间序列的聚类,并从受金融因素驱动的扰动中获得见解应用。为了验证所提出的扰动,我们将其应用于研究一个大型市场价格CDS数据集。我们在这个数据集上比较了使用几个距离矩阵Dij:oDPij=(1)得到的聚类-ρij)/2,其中ρij是皮尔逊相关系数,oDSij=(1)- ρSij)/2,其中ρSijis是斯皮尔曼相关性,oDEijis是欧几里德距离,odgij是设计用于处理i.i.d.的距离。

地板
可人4 在职认证  发表于 2022-5-10 11:54:56
随机过程[20]。我们的实验研究主张:o如果资产之间的依赖性是研究的唯一重点,那么DSij(斯皮尔曼)应该优先于DPij(皮尔逊);数据不应用于比较财务时间序列;最后,DGIJ是最通用的,在所有提议的扰动下都表现良好,其主要表现与DSIJ相似,应优先考虑如果聚类算法能保持适当的距离,则聚类可以通过广泛的扰动保持。此外,我们还观察到了一些关于CDS市场的有趣事实,并通过利用数据驱动文档库中的ankey图来说明集群的稳定性。二、金融时间序列的扰动框架可以对价格(每个时间序列的一些T值)或资产(Ntime序列本身的一些)执行。具体地说,这些扰动包括按行或按列修改N×T数据矩阵。A.时间扰动我们在下面提供了一些关于T时间序列值的扰动列表。我们解释了他们因财务问题而产生的动机,以及通过分析聚类稳定性,我们可以从他们身上学到什么。滑动窗口:动机:模型的动态稳定性是交易和风险信息系统的一个要求。例如,风险价值(VaR)是指在一个移动窗口上计算,并根据资产价格流进行更新的估计金额,以使投资组合在给定时间跨度内的潜在损失不应超过。

7
能者818 在职认证  发表于 2022-5-10 11:55:00
在投资组合中不存在风险,且处于固定状态时,VaR不应变化太大。定义:给定一个窗口宽度W和步长S,对X进行聚类:,[tcur,tcur+W[andX:,[tcur+S,tcur+S+W][,然后是当前时间TCURI更新的tcur:=tcur+S,等等。洞察:当市场似乎处于稳定状态时,一次又一次存在巨大差异的集群应该被拒绝,因为它对噪音非常敏感,即小的不确定性市场变化。如果方法论的可信度很高,集群的修改可能是市场结构正在变化的信号(例如,危机的结束和全球相关性的降低)。奇数与偶数:动机:应用于描述同一现象的两个样本的聚类算法应该产生相同的结果。如何获得其中两个样本?我们的目标是将样本一分为二,同时减轻非平稳性、季节性、周末交易活动、欧洲央行或欧洲期货交易所的会议和公告通常在周五发生的影响。定义:我们定义X(1)={X:,t | t是奇数}和X(2)={X:,t | t是偶数},即我们构建奇数交易日和偶数交易日的样本。由于交易周持续5天,我们缓解了上述统计偏差。聚类是在X(1)和onX(2)上独立执行的。洞察:如果不稳定,则应删除聚类方法。经济制度:动机:由于经济环境可能会发生巨大变化,金融时间序列从长远来看不会处于稳定的制度中。将时间跨度分为不同的时段是有意义的,在这些时段中,统计区域可以被视为静止的。定义:我们将样本划分为M个子样本X=tMi=1X(i),其中X(i)=X:,[ti,ti+1],以及(ti)M+1i=1个传递时间间隔。

8
kedemingshi 在职认证  发表于 2022-5-10 11:55:03
断点(ti)M+1i=1可以根据市场理解进行选择,或者使用动态变化和制度检测算法进行计算。洞察:我们可以研究集群结构是否存在于不同的经济体制中,以及其强度如何。如果没有,相关的时期是什么,变化有多大?涉及哪些资产?为什么它们会从集群中切换?它们和它们的星系团怎么了?然而,我们必须记住,将信号从聚类方法的噪声中分离出来是非常困难的。图1:2006年至2015年,使用6个月的滑动窗口计算的wholeCDS数据集上的平均相关动态心脏vs.尾巴:动机:处于压力下的市场与处于不同时期的市场是否具有共同的聚类结构?定义:设Xt=NPNi=1Xi,t为市场的平均时间序列。设Qbe为下四分位数,Qbe为上四分位数。我们定义T={T|Xt≤ Q∨ Xt≥ Q} H={t|Xt/∈ T}对应于尾部和心脏分别具有市场价值的时代。然后我们将sampleX拆分为以下两个子样本X(1)={X:,t|t∈ T}和X(2)={X:,T|T∈ H} 我们应用了同样的聚类算法。洞察:尽管很难预测市场行为的变化,但在压力期间,所有资产往往同时受到宏观经济紧张局势的影响,这通常会导致它们之间的相关性显著增加(见图1)。因此,相关性应该不那么具有辨别力,并且基于相关性的聚类相对于这种扰动可能是不稳定的。多尺度:动机:市场价格可以从高频率采样(滴答滴答或每分钟)到低得多的频率(从小时到小时、每天或每周)进行监控。

9
kedemingshi 在职认证  发表于 2022-5-10 11:55:07
使用的采样频率与交易类型有关,从高频交易(HFT)和算法交易到长期投资。聚类结构是在广泛的时间范围内持续存在,还是强烈依赖于抽样?定义:从X我们可以建立M个数据集X(i)=X:,si,i=1,M其中siare是{1,…,T}的规则间隔多尺度子样本。洞察:理想情况下,从构建风险系统的角度来看,我们希望风险因素的选择独立于用于分析的时间尺度。这种扰动使我们能够验证聚类在多尺度上的持久性。到期日:动机:例如债券、掉期和CDS等固定收益资产的寿命称为到期日。不同期限的几种产品(针对公司1年、2年、3年、5年、7年或10年违约的萨扬保险)可能涉及同一实体。由于潜在的风险是相同的,我们希望类似的集群。定义:我们从市场上获得多个时间序列数据集X(i),每个报价到期日一个N×T数据矩阵。洞察:我们可以拒绝一种聚类方法,这种方法会导致不稳定的聚类,或者研究为什么一个特定的聚类结构与其他聚类结构不同。期限结构:动机:期限结构是所有报价到期日的集合。对术语结构进行聚类可以得到比单独聚类更有意义的结果。定义:对于术语结构的聚类,需要一个特定的距离。据我们所知,获取一个能够捕获整个信息(例如,其失真的动态、分布和相关性)的合适信息的问题尚未解决。这里,我们给出了一个在给定日期t对结构进行聚类的简单方法。

10
大多数88 在职认证  发表于 2022-5-10 11:55:10
违约概率P(t)可以看作是R+上的累积分布函数。事实上,违约概率正在增加,瞬时违约概率为0,最终所有实体都将违约。因此,f(t)=P(t)/t在R+上定义概率密度函数,sinceRR+f(t)dt=1,pf(t)是L(R)中的单位向量。两个单位向量之间的内积定义了一个角度φ,即两项结构之间的距离。给定两个项结构P,Pand f,fsuch,fi(t)=π(t)/t、 它们的距离φ可以写为φ=RR+pf(t)pf(t)dt=1- H(pf(t),pf(t)),其中H是海林格距离。洞察:对于接近违约的实体,期限结构应该颠倒,也就是说,如果这些实体存活下来,市场预计将进行重整。对于似乎没有问题的实体,所引用的期限结构应反映这些实体的债务期限结构。一些行业有特殊的债务结构(金融的短期债务,基础材料和工业的长期债务)。部分信息还应通过agiven到期日资产之间的相关性来获取。B.总体扰动在所提出的基于时间的扰动中,我们在资产集上添加了以下两种基于总体的扰动:增加/减少实体的数量,以及使用估算的历史价格添加实体。这些不安很容易被激发:新公司经常出现,其他一些公司则从市场上消失。当从集群外围添加或移除实体时,集群结构不应发生根本性变化。当新公司创建并引入市场时,它们没有多少历史。例如,可能有必要根据聚类方法对缺失数据进行插补。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 18:03