楼主: mingdashike22
417 10

[量化金融] 全球原油的相关结构和主成分 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8216
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-6-9 10:42:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Correlation structure and principal components in global crude oil
  market》
---
作者:
Yue-Hua Dai (ECUST), Wen-Jie Xie (ECUST), Zhi-Qiang Jiang (ECUST),
  George J. Jiang (WSU), Wei-Xing Zhou (ECUST)
---
最新提交年份:
2014
---
英文摘要:
  This article investigates the correlation structure of the global crude oil market using the daily returns of 71 oil price time series across the world from 1992 to 2012. We identify from the correlation matrix six clusters of time series exhibiting evident geographical traits, which supports Weiner\'s (1991) regionalization hypothesis of the global oil market. We find that intra-cluster pairs of time series are highly correlated while inter-cluster pairs have relatively low correlations. Principal component analysis shows that most eigenvalues of the correlation matrix locate outside the prediction of the random matrix theory and these deviating eigenvalues and their corresponding eigenvectors contain rich economic information. Specifically, the largest eigenvalue reflects a collective effect of the global market, other four largest eigenvalues possess a partitioning function to distinguish the six clusters, and the smallest eigenvalues highlight the pairs of time series with the largest correlation coefficients. We construct an index of the global oil market based on the eigenfortfolio of the largest eigenvalue, which evolves similarly as the average price time series and has better performance than the benchmark $1/N$ portfolio under the buy-and-hold strategy.
---
中文摘要:
本文利用1992年至2012年全球71个油价时间序列的日收益率,研究了全球原油市场的相关结构。我们从相关矩阵中确定了六组具有明显地理特征的时间序列,这支持Weiner(1991)的全球石油市场区域化假设。我们发现,时间序列的簇内对具有高度相关性,而簇间对具有相对较低的相关性。主成分分析表明,相关矩阵的大多数特征值都位于随机矩阵理论的预测范围之外,这些偏离特征值及其对应的特征向量包含着丰富的经济信息。具体而言,最大特征值反映了全球市场的集体效应,其他四个最大特征值具有区分六个集群的分区函数,最小特征值突出了相关系数最大的时间序列对。我们基于最大特征值的特征值Fortfolio构建了一个全球石油市场指数,该指数与平均价格时间序列的演化过程类似,在买入持有策略下,其表现优于基准1美元/牛美元投资组合。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--

---
PDF下载:
--> Correlation_structure_and_principal_components_in_global_crude_oil_market.pdf (2.42 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:主成分 Quantitative coefficients correlations Econophysics

沙发
何人来此 在职认证  发表于 2022-6-9 10:43:15
(2013)通过使用阈值误差修正模型和从基准市场到中国石油市场的单向波动溢出,研究中国和四大原油市场之间的整合,研究区域化问题。他们的结果不支持“一个大池”的假设。我们的工作通过主成分分析(Jolli ffe,2002)和随机矩阵理论(Mehta,2006)揭示了全球原油市场的相关结构,为这篇文献做出了贡献。主成分分析已广泛应用于金融领域(例如,见Kritzman et al.,2011;Billio et al.,2012以及其中的参考文献)。然而,主成分分析在能源市场研究中的应用较少。Chantziara和Skiadopoulos(2008)对纽约商品交易所的原油、取暖油和汽油价格以及国际石油交易所的原油期货进行了主成分分析,并表明保留的主成分在预测价格方面的能力有限。另一方面,随机矩阵理论已广泛应用于研究多个金融时间序列(Laloux et al.,1999;Plerou et al.,1999;Kwapien and Drozdz,2012)。随机矩阵理论本质上等价于主成分分析,因为它们都处理相关矩阵及其特征值。在随机矩阵理论的框架下,如果实时序列的特征值与随机矩阵理论的预测不同,那么这些偏离的特征值中必然存在隐藏的经济信息。

藤椅
何人来此 在职认证  发表于 2022-6-9 10:43:19
对于股票市场,存在多个偏离特征值,其中最大特征值反映整个市场的集体效应,其他最大特征值可用于识别工业部门(Plerou et al.,2002)或具有强互相关的股票集群(Shen和Zheng,2009)。可以为住房市场Meng et al.(2014)和全球股票市场Song et al.(2011)提取不同的信息。此类分析使我们能够发现市场驱动力(Shapira等人,2009)以及相互和共同影响(Garas和Argyrakis,2007)。我们利用来自不同国家的71个现货价格时间序列,运用主成分分析和随机矩阵理论研究了全球原油市场的相关结构。我们能够识别出六组具有明显地理特征的油价时间序列。这一发现支持Weiner(1991)的区域化假设。我们还从偏离特征值中提取了丰富的经济信息,这表明全球原油市场具有非常明显的相关结构。本文的其余部分组织如下。第2节描述了数据集并给出了汇总统计数据。第3节研究了全球原油市场的相互关联结构。第四节研究了相关矩阵,探讨了嵌入主成分和最小特征值中的经济信息内容。我们在第二节得出结论。5.2. 数据说明2.1。数据集我们从彭博社数据库中检索到全球各市场原油每日现货价格时间序列71。现货价格时间序列涵盖1992年10月至2012年12月的一段时间。这些原油价格时间序列在几个方面有所不同。

板凳
kedemingshi 在职认证  发表于 2022-6-9 10:43:22
石油市场可能位于不同的国家或地区,包括主要的原油出口国,如伊朗和沙特阿拉伯,或一个国家的不同地方。特别是一些油价系列1992 1996 2000 2004 2008 2010100200吨P,我PI1992 1996 2000 2004 2008 201-0.200.2吨r图1:(彩色在线)日均价格的演变,基于最大特征值的特征组合构建的指数,以及原油的平均对数回报。根据不同的原油质量(包括密度和硫含量)记录。对于原始数据,我们将它们相交,然后补足与前一天相同的缺失数据的价格。如果前一天的数据仍然缺失,我们将用前一天的数据进行补充,其余数据将以相同的方式进行。表1.2.2列出了不同原油的标签、相应的股票代码名称和时间序列长度。返回在时间尺度上第i个原油价格序列的对数返回t的计算如下:ri(t)=ln Pi(t)- ln Pi(t- t) ,(1)其中Pi(t)表示t时第i个原油的价格。请注意,表1的FirstColumn中给出了每个时间序列的标签i。在这项工作中,我们用t=1天。为了考虑到全球原油的不同步交易,我们重复了每周收益分析t=7天。周收益率的结果与每日数据在质量上相同。在我们的分析中,剔除了异常大的价格波动(>40%)。然而,纳入这些大型函数并不会改变主要结果。表1列出了每个时间序列的每日收益汇总统计数据。通常,如果时间序列的绝对最小收益(Min)较大,则最大收益(Max)较大。

报纸
大多数88 在职认证  发表于 2022-6-9 10:43:27
这一特征源于时间序列在地理上的接近性,例如中东地区约60个区块。我们还发现,亚太地区的原油价格与中东地区的原油价格相关,但与美国和欧洲市场的相关性很低。主要原因是,亚洲和太平洋地区的原油是从中东地区进口的,价格由这些地区的官员决定。在样本期间,平均相关系数hci=0.57远高于大多数股票市场(Plerou等人,2002;Pan和Sinha,2007;Shen和Zheng,2009),这表明原油市场比股票市场更容易受到风险的影响。3.2. 聚类识别为了客观地提取时间序列的聚类,我们采用现代算法进行复杂网络中的社区检测。对于相关矩阵C,根据Lanchichinetti和Fortunato(2012)以及Meng et al.(2014)的思想,我们结合Sales Pardo et al.(2007)的盒聚类算法和Lanchichinetti和Fortunato(2012)的一致聚类方法来搜索原油时间序列的聚类。我们首先确定C中靠近后对角线i=-j、 其中,采用模拟退火方法最小化成本函数q=Xi,j=1Ci j | i- j |。(4) 然后,我们使用贪心算法对时间序列进行聚类(Sales Pardo et al.,2007)。我们重复这个过程200次,得到200个分区。我们构造了一个单元矩阵a,其中元素Ai是i和j分配给同一集群的分区数,除以分区数200。此外,我们将聚类方法应用于单位矩阵a,得出最终分区a(Lanchichinetti和Fortunato,2012)。

地板
nandehutu2022 在职认证  发表于 2022-6-9 10:43:34
因此,全球石油市场的相关结构表现出显著的地理特征,这让人想起全球股市(Song et al.,2011)和美国住房市场(Meng et al.,2014)。LabelLabel 10 20 30 40 50 60 701020030405060700.1.2.3.4.5.6.7.8.9 LabelLabel 4340 46 44 42 41 59 60 63 5862 61 57 9 8 10 1 56 5053 6 6 6 6 6 6 6 9 11 38 25 36 35 37 29 20 32 16 34 18 21 14 28 31 33 64 22 51 52 55 49 70 67714340464744454241395960635862615798101565053765234544865669313151911382535372930242032263418122141414141414172114728273123336422516825255255497067710.10.30.40.50.60.70.80.91(a)(b)(c)图2:(彩色在线)全球71个原油价格时间序列的互相关结构。(a) 每日对数回报的相关矩阵。(2) 使用盒子聚类算法和一致性聚类方法对油价时间序列进行聚类识别。(c) 六个簇的彩色贴图。0 0.2 0.4 0.6 0.800.511.522.53cijP(cij)图3:相关系数的分布。3.3. 相关系数的分布我们在图3中绘制了相关系数的分布。可以很容易地识别出四个明显的峰值。这一特征源于全球石油市场一体化程度较低的事实,如图2所示。在金融市场中未观察到相关系数分布中的这种多模态模式。通常,我们观察金融市场的统一分布,包括全球股票市场(Song et al.,2011)和美国住房市场(Meng et al.,2014),我们观察到类似的地理特征。右峰值对应于图2(b)中沿后对角线的簇内时间序列之间的最大相关系数。

7
nandehutu2022 在职认证  发表于 2022-6-9 10:43:38
右侧的第二个峰值突出显示了集群3、4和5的集群间时间序列之间的相关性。在某种意义上,图2(b)说明了这三个集群可以被视为一个大集群。左侧峰值包含簇1与簇3、4、5和6之间的相关系数。左侧的第二个峰值表示除左侧峰值以外的簇间时间序列之间的相关系数。我们可以看到,图3展示了全球石油市场的一幅图景,具有明显的本地化特征。4、特征值和信息内容4.1。特征值的分布对于每个原油价格序列的相关矩阵C,我们可以计算其特征值,C=U∧UT,(5)其中U表示特征向量,λ是相关矩阵的特征值,其密度fc(λ)定义如下Laloux et al.(1999),fc(λ)=Ndn(λ)dλ,(6)其中n(λ)是小于λ的C的特征值数。如果M是均值和单位方差为零的T×N随机矩阵,则fc(λ)是自平均。特别是在极限N→ ∞, T→ ∞ Q=吨/吨≥ 1固定,随机相关矩阵M的特征值λ的概率密度函数fc(λ)具有紧密形式(Edelman,1988;Sengupta和Mitra,1999;Laloux等人,1999):fc(λ)=Q2πσ√(λmax- λ)(λ - λmin)λ(7)带λ∈ [λmin,λmax],其中λmaxmini由λmaxmin=σ(1+1/Q±2p1/Q),(8)0 0.5 1 1.502468101214λP(λ)0 20 400 51015λP(λ)图4:插入图中具有大特征值的相关矩阵C的特征值的经验分布。实线是随机矩阵理论预测的公式(7)中表示的理论分布。σ等于M元素的方差(Sengupta和Mitra,1999;Laloux等人,1999)。在我们的例子中,Q=5272/71=74.3,在我们的归一化数据中,方差σ等于1。

8
可人4 在职认证  发表于 2022-6-9 10:43:41
如果C是一个随机矩阵,根据公式(8),最大特征值λRMTmax=1.2456,最小特征值λRMTmin=0.7814。我们计算了相关矩阵C的N个特征值,λmax=λ>λ>λ>λ=λmin。我们发现最大特征值λmax=43.76,最小特征值λmin=0.00073。图4说明了这些特征值的经验分布和基于随机矩阵理论的理论分布。理论曲线上只有两个特征值λ和λ。五个最大特征值大于λrmtmax,其他64个特征值小于λRMTmin。经验分布与理论预测的偏差意味着相关矩阵C不是随机矩阵,偏差特征值中嵌入了经济信息。4.2. 特征组合为了揭示偏离特征值中的信息内容,我们为每个特征值构造特征组合。对于λk,我们有rk(t)=uTk·rPNi=1ui,k=PNi=1ui,kNXi=1ui,kri(t),(9),其中uTk·r是归一化返回向量r在第k个特征向量uk上的投影。图5(a)说明了特征投资组合与平均回报hri之间的关系。有一个明显的线性关系,R平方非常高,为0.97。因此,最大特征值反映了驱动全球原油市场的一个共同因素。因为最大特征值解释了价格波动变化的λ/N=61.63%,所以这个共同因素意味着整个市场模式的集体影响。此外,图5(b)显示,第一个特征向量的所有分量具有相同的符号,并且不是随机分布的。然而,对于其他特征值,未观察到平均收益与特征投资组合之间的明显关系,这意味着其他偏离特征值不会产生任何市场范围的影响。

9
大多数88 在职认证  发表于 2022-6-9 10:43:46
这些观察结果也针对股票市场进行了报道(Plerou等人,2002年)。由于最大特征值反映了原油市场的全球走势,我们可以基于最大特征值的特征组合构建全球原油市场指数:I(t)=hP(0)iexpTXt=1R(t)(10) 其中,hP(0)i=19.4704是1992年10月2日的平均价格。我们将构建的指数与图1(a)中的平均价格进行比较。研究发现,该指数的演变与预期的平均价格非常相似。此外-0.2-0.1 0 0.1 0.2-0.4-0.200.20.4rR10 20 40 6000.050.10.150.2标签1-0.2-0.1 0 0.1 0.2-0.4-0.200.20.4rR2级-0.2-0.1 0 0.1 0.2-4.-20246rR3级-0.2-0.1 0 0.1 0.2-50510rR4级-0.2-0.1 0 0.1 0.2-1.-0.500.51rR5(a)(b)(c)(d)(e)(f)图5:测试集体市场效应。(a) 平均回报率hri与最大特征值λ的特征投资组合R.(b)分量uo之间的关系。(c) 平均回报率hri与特征投资组合R之间的关系。(d)平均回报率hri与特征投资组合R之间的关系。(e)平均回报率hri与特征投资组合R之间的关系。(f)平均回报率hri与特征投资组合R之间的关系。由于指数总是高于平均价格。4.3. 其他最大特征值和股票市场的分割效应,其他大于λrmtmax的偏离特征值包含工业部门的分割信息(Plerou等人,2002)。按照这个想法,我们在图6的左面板中显示了四个特征向量。我们已经可以看到具有类似高度的组件集群。这些组件集群对应于图2中的集群。为了进一步说明这一点,我们在图的右面板中绘制。

10
可人4 在职认证  发表于 2022-6-9 10:43:55
6基于六个簇重新排序的特征向量。4.4. 最小特征值和高度相关对揭示了大于λrmtmax的偏离特征值及其对应的特征向量所携带的潜在信息,我们现在开始研究最小特征值中的隐藏信息。根据toPlerou et al.(2002),最小特征值及其对应的特征向量代表股票的高相关性时间序列对。我们在全球原油市场上发现了类似的信息。图7显示了四个最小特征向量的特征向量。在u、u和u的每个图中,我们观察到一系列具有相反符号和显著大幅度的分量。我们定位每个成分的价格标签,并计算每对回报时间序列之间的相应相关系数。Sirtica和Zueitina的两个时间序列,其相关系数c27,28=0.9992是所有相关系数中最高的。uare Escravos和Pennington的一对,其相关系数c31,33=0.9960是所有ci j中的第二大,而特征向量uare Arab Medium到美国和Arab Heavy到美国的一对,c53,56=0.9953,第三大。0 20 40 60-0.4-0.200.20.4Labelu21 2 3 4 5 6-0.4-0.200.20.4聚类20 20 40 60-0.4-0.200.20.4Labelu31 2 3 4 5 6-0.4-0.200.20.4聚类30 20 40 60-0.4-0.200.20.4Labelu41 2 3 4 5 6-0.4-0.200.20.4聚类40 20 40 60-0.4-0.200.20.4Labelu51 2 3 4 5 6-0.4-0.200.20.4聚类5(a)(b)(c)(d)(e)(f)(g)(h)图6:(彩色在线)与四个偏差值λ至λ相关的特征向量u(a,b)、u(c,d)、u(e,f)和u(g,h)的分区效应。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 14:48