楼主: 何人来此
1273 22

[量化金融] 金融网络的动态多因素聚类 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-8 04:48:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Dynamic Multi-Factor Clustering of Financial Networks》
---
作者:
Gordon J. Ross
---
最新提交年份:
2015
---
英文摘要:
  We investigate the tendency for financial instruments to form clusters when there are multiple factors influencing the correlation structure. Specifically, we consider a stock portfolio which contains companies from different industrial sectors, located in several different countries. Both sector membership and geography combine to create a complex clustering structure where companies seem to first be divided based on sector, with geographical subclusters emerging within each industrial sector. We argue that standard techniques for detecting overlapping clusters and communities are not able to capture this type of structure, and show how robust regression techniques can instead be used to remove the influence of both sector and geography from the correlation matrix separately. Our analysis reveals that prior to the 2008 financial crisis, companies did not tend to form clusters based on geography. This changed immediately following the crisis, with geography becoming a more important determinant of clustering.
---
中文摘要:
我们研究了当存在多种因素影响相关结构时,金融工具形成集群的趋势。具体来说,我们考虑一个股票投资组合,其中包含来自不同工业部门、位于几个不同国家的公司。行业成员资格和地理位置共同构成了一个复杂的集群结构,在这个结构中,公司似乎首先根据行业进行划分,每个行业中都出现了地理子集群。我们认为,用于检测重叠集群和社区的标准技术无法捕捉这种类型的结构,并展示了如何使用稳健回归技术来分别从相关矩阵中去除行业和地理的影响。我们的分析表明,在2008年金融危机之前,公司并不倾向于根据地理位置形成集群。这一点在危机之后立即发生了变化,地理位置成为了集群的一个更重要的决定因素。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Dynamic_Multi-Factor_Clustering_of_Financial_Networks.pdf (452.65 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多因素 金融网 Geographical Quantitative Applications

沙发
nandehutu2022 在职认证  发表于 2022-5-8 04:49:01
金融网络的动态多因素聚类英国布里斯托尔大学数学研究所戈登J·罗斯海尔布朗。ross@bristol.ac.uk(日期:2018年10月19日)我们研究了当存在影响相关结构的多个因素时,金融工具形成集群的趋势。具体而言,我们考虑的股票组合包括来自不同工业部门的公司,这些公司位于几个不同的国家。部门成员身份和地理位置结合在一起,形成了一个复杂的集群结构,在这个结构中,公司似乎首先根据部门进行划分,每个工业部门中都出现了地理子集群。我们认为,检测重叠集群和社区的标准技术无法捕捉这种类型的结构,并展示了如何使用稳健的回归技术来分别从相关矩阵中去除行业和地理的影响。我们的分析表明,在2008年金融危机之前,公司并不倾向于根据地理位置组建集群。这一点在危机后立即发生了变化,地理位置成为了集群的一个更重要的决定因素。金融市场为研究复杂网络提供了丰富的应用领域。在金融网络中,节点代表金融工具,而边缘权重表示这些工具在一段时间内的价格变化之间的相关性。

藤椅
能者818 在职认证  发表于 2022-5-8 04:49:04
研究金融网络的目的是获取有关潜在相关性结构的信息,并更好地了解各种现实因素对其的影响,这对风险管理非常重要[?],投资理论[?],andindex跟踪[?]。许多工作都集中在检测金融网络中的集群这一任务上,对应于股票价格变动高度相关的公司群体。人们发现,公司往往根据所属的工业部门形成集群,例如,银行的行为往往与电信公司不同[??]。这些研究通常只侧重于对位于一个国家的公司进行分析,但也进行了类似的货币汇率和国家股票指数分析[??]这表明,也有证据表明,东亚货币的行为倾向于与欧洲货币不同,因此也存在基于地理位置的集群。关于金融关联网络的现有文献主要集中在只有一个因素影响关联结构的情况下——研究单个公司时的成员资格,以及研究货币汇率或国家股票指数时的地理位置。然而,许多真实的投资组合将受到多个因素的驱动。例如,包含分布在多个行业、位于多个不同国家的公司的投资组合可能会形成基于行业和地理位置的集群,西班牙银行的行为方式与英国银行不同。只关注一个集群因素(如行业)的分析不适合这种类型的数据。

板凳
kedemingshi 在职认证  发表于 2022-5-8 04:49:07
考虑到这一点,我们开发了一些技术,这些技术可以减少多个因素来驱动相关结构。我们表明,在一个简单的分析中,它似乎主要是影响集群的行业成员。然而,仔细观察就会发现,尽管这一点受到了部门效应的影响,但似乎存在着地理聚集现象。为了揭示地理的真实影响,我们可以进行转换,去除部门成员影响的相关矩阵。最后,我们调查了行业和地理对集群结构的影响如何随时间演变,最近的金融危机期间发生了一个特别重要的变化,在受主权债务危机影响最大的国家,地理开始成为一个更重要的决定因素。理解财务相关性的时间动态是一个重要的研究领域[??],我们的分析表明,在存在多个潜在聚类因素的情况下,这是如何明智地进行的。二、数据我们将分析的数据包括350家公司的每日收益,这些公司组成了标准普尔350欧洲股票指数。该指数中的公司是欧洲大陆最大的公司之一,合计约占欧洲总市值的70%。我们获得了2003年1月1日至2012年3月17日期间每家公司的每日收盘价。

报纸
mingdashike22 在职认证  发表于 2022-5-8 04:49:10
为了避免在大不相同的时区之间同步价格的困难问题,我们排除了仅在非欧洲证券交易所交易的公司,以及2003年1月1日之前没有股票报价的公司,或在部门编号国家编号材料30英国79主要消费品24法国44金融57德国33公用事业16瑞典24电信服务15意大利18工业45西班牙16非必需消费品44瑞士12信息技术10荷兰8能源11希腊5医疗保健16表一:每个国家的公司数量本期数据集中出现的行业和国家。我们总共有267家公司的数据。为了避免与不同货币的影响有关的问题,我们使用相关的历史汇率将每家公司的结算价格换算成欧元。最后,标准普尔根据全球行业分类标准(GICS)对这些公司进行了行业分类,每个公司被分配到10个不同的可能行业中的一个。我们将使用它来检查数据中发现的聚类是否重现真实的模式。数据集中属于每个部门和地理区域的公司数量如表一所示,我们省略了包含少于5家公司的国家,因为此类小样本可能不允许进行准确分析。需要注意的是,GICS部门分类非常广泛,每个部门都有许多细分;例如,被标为金融类的集团包括银行和保险公司,它们的行为方式可能不同,而能源行业内的石油公司的行为可能与其他非石油能源公司略有不同。

地板
mingdashike22 在职认证  发表于 2022-5-8 04:49:13
这一点在评估Sec中集群结构的质量时非常重要。V A.III.聚类算法聚类是将对象分配给组的过程,根据特定的距离度量,同一组中的对象相似,而不同组中的公司则不同。在[??]中。,我们根据公司每日股票收益率之间的相关性,对公司的空间设置了一个状态度量。设Pi,tdenote为公司ion day t的股票价格(单位:欧元),并设ri,t=log Pi,t- 对数π,t-1删除每日收益的对数。然后,基于整个期间的等权天数,公司i和j之间的皮尔逊相关性为:ρij=PTt=1ri,tPTt=1rj,tqPTt=1ri,tPTt=1rj,T.(1)任何两个公司i和j之间的距离可以定义为:Wij=q2(1)- ρij)。(2) 在那里可以看到Wij∈ [0,1],如果公司完全相关,Wij=0。虽然有许多可能的聚类算法,但我们选择使用平均链接聚集层次聚类(HC)[?]。这是因为如上所述,GICS行业标签是宽泛的,有理由相信在每个宽泛的标签下可能存在子行业的层级。HC算法的完整描述可以在上面的参考文献中找到,我们只在这里进行总结。给定距离矩阵{Wij},HCM通过基于贪婪优化递归地将公司合并为集群来执行聚类。最初,n家公司中的每一家都被分配到自己的集群,从而形成n个集群{c,…,cn}。然后,HC选择距离最近的一组簇,并依次合并它们,直到只剩下一个簇。HC算法的输出是一个树状图。这是一个树结构,显示了聚类的合并顺序。每个公司都被描绘成一片树叶。

7
可人4 在职认证  发表于 2022-5-8 04:49:16
当两个簇由HC连接时,它们之间会添加一个链接。树状图可以可视化数据的层次聚类结构,因为可以很容易地查看公司、集群和子集群之间的关系。四、 “隐藏”聚类在继续分析数据之前,我们首先描述当多因子影响聚类结构时可能出现的问题。在一个典型的股票投资组合中,每家公司都有一个工业部门成员和一个地理位置。在正常的市场行为时代,我们将在后面展示网络的集群结构在很大程度上归因于部门成员。然而,有一个明显的子集群,例如位于英国的银行的行为与位于德国的银行略有不同。这表明,相关矩阵的结构是由两个不同维度的相互作用形成的,一个对应于行业成员,另一个对应于地理位置。由于行业成员通常是影响相关矩阵的主要因素,因此原始数据多少掩盖了地理因素的影响。这个问题明显不同于文献中关于检测重叠社区的通常情况[?]这就假定,尽管这些社区可能属于多个社区,但这些不同的社区是不同的,并且结构良好。图1a显示了这种情况的一个示例,它显示了在二维空间中绘制的红色和绿色两个重叠簇的表示。一小部分-2.-1012-4.-2 0 2 4(a)-202-6.-4.-2 0 2 4(b)图1:(a)显示了一个典型的场景,其中两个集群由于属于这两个集群的多个点(蓝色)而发生冲突。

8
可人4 在职认证  发表于 2022-5-8 04:49:20
(b) 显示“隐藏”簇的情况,其中基于颜色的主要特征掩盖了将点分组为圆形或三角形的特征的影响。两个星团都有许多点,用蓝色绘制。相比之下,我们的情况类似于图1b所示。在这里,每个点都有两个附加的二进制特征,比如A和B。如果特征A的值为1,则点为红色,如果值为0,则点为蓝色。类似地,如果特征B的值为1,则该点用圆表示,否则用角表示。从图中可以清楚地看出,特征A对聚类结构的影响最大,各点根据其值进行了很好的分离。然而,特征B也有一定的权重,每个簇内的点都基于此进行分组。如果我们天真地对这些数据运行聚类算法,那么它将无法检测特征B对聚类的影响,因为这是由于a的强烈影响而掩盖的。为了揭示B的真实影响,我们必须首先转换数据,以原则性的方式消除特征a的影响。一个可能被问到的合理问题是:如果地理等次要因素所隐含的聚类结构在金融数据中被掩盖到无法立即检测到的程度,那么为什么会引起人们的兴趣?简单的答案是,真实数据的相关结构通常不是静态的,而是随时间而变化的。尽管基于地理位置的聚类有时可能会被掩盖,但正如我们将在2008年金融危机中展示的那样,它在未来可能会变得更加主导。V.静态分析我们通过使用在整个8年数据中定义的静态相关矩阵开始数据分析,忽略任何时变结构。

9
何人来此 在职认证  发表于 2022-5-8 04:49:24
为了帮助解释HC算法发现的聚类,将相关矩阵投影到二维空间以更好地显示其结构非常有用。虽然实际的聚类是在原始的高维空间中执行的,而不是在二维空间中执行的,但这种表示可以提供数据的有趣的视觉摘要。多维缩放(MDS)可以用于此目的。MDS是统计分析中的传统工具,它允许高维数据绘制在欧几里德平面[?]上。给定一组n个对象和一个任意距离矩阵{Wij},其中wijdenotest对象i和对象j之间的距离,MDS在二维中搜索对象的表示,使每对对象之间的距离尽可能接近原始高维空间中它们之间的距离。换句话说,它寻求n个向量xi的集合∈ 令人满意的:minx,。。。,xnXi<j(| | xi)- xj | |- Wij)。图2a显示了数据的MDS图,其中每个公司由表示其部门的彩色点表示,每个部门具有不同的颜色。如果同一行业的公司确实以类似的方式行事,那么它们在这一点上就会彼此接近,我们会看到大量的公司都有相同的颜色。事实就是这样,右下角的金融部门(绿色)的公司与其他公司的区别尤其明显。然而,各部门之间也存在大量重叠;例如,从图的顶部可以看出,虽然工业部门(蓝色)和材料部门(青色)的公司确实与其余公司分离,但它们往往非常相似。

10
可人4 在职认证  发表于 2022-5-8 04:49:27
这说明了为什么以前的基于部门的聚类方法,比如[?]只取得了有限的成功;尽管数据中存在部门分组,但这还不足以形成完全分离的部门,而且存在大量重叠。接下来,图2b显示了相同的MDS图,这些公司根据其地理位置而非行业成员身份进行着色。很明显,与前一个图相比,聚类结构较少,这表明地理位置对聚类没有很大影响。然而,这种天真的分析有点误导。以右上角的工业公司为例,它们在前一张图片中是蓝色的。在这些行业中,存在基于地理位置的特定子集群,这在图2b顶部的五家公司中最为明显。它们在工业领域形成了一个独特的群体,与该领域的其他部分有着不同的颜色,表明它们与其他国家(德国)不同。在图2b的右下角,我们可以看到一幅类似的图片,展示的是金融公司;在这一领域,同样可以看到,同一个国家的人往往更亲密,这表明他们有类似的行为。在整个情节中可以观察到相同的模式,这表明-0.4-0.20.00.20.4-0.4-0.20.0.2(a)-0.4-0.20.00.20.4-0.4-0.2 0.0 0.2(b)(c)(d)图2:图(a)显示了一个数据的MDS图,其中公司根据其工业部门成员进行了着色。图(b)显示了相同的,但根据地理位置用颜色表示。无花果。(c) 和(d)显示了各自的密度图,图(c)以部门成员身份为基础进行了着色,图。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-19 21:55