楼主: 能者818
1065 23

[量化金融] 建立股票关系网络的多似然方法 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
37.8378
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-6-24 05:07:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Multi-Likelihood Methods for Developing Stock Relationship Networks
  Using Financial Big Data》
---
作者:
Xue Guo, Hu Zhang, Tianhai Tian
---
最新提交年份:
2019
---
英文摘要:
  Development of stock networks is an important approach to explore the relationship between different stocks in the era of big-data. Although a number of methods have been designed to construct the stock correlation networks, it is still a challenge to balance the selection of prominent correlations and connectivity of networks. To address this issue, we propose a new approach to select essential edges in stock networks and also maintain the connectivity of established networks. This approach uses different threshold values for choosing the edges connecting to a particular stock, rather than employing a single threshold value in the existing asset-value method. The innovation of our algorithm includes the multiple distributions in a maximum likelihood estimator for selecting the threshold value rather than the single distribution estimator in the existing methods. Using the Chinese Shanghai security market data of 151 stocks, we develop a stock relationship network and analyze the topological properties of the developed network. Our results suggest that the proposed method is able to develop networks that maintain appropriate connectivities in the type of assets threshold methods.
---
中文摘要:
发展股票网络是探索大数据时代不同股票之间关系的重要途径。虽然已经设计了许多方法来构建股票相关性网络,但如何平衡显著相关性的选择和网络的连通性仍然是一个挑战。为了解决这个问题,我们提出了一种新的方法来选择股票网络中的关键边,并保持已建立网络的连通性。这种方法使用不同的阈值来选择连接到特定股票的边,而不是在现有的资产价值方法中使用单个阈值。我们算法的创新之处在于,在选择阈值的最大似然估计中加入了多个分布,而不是现有方法中的单一分布估计。利用中国上海证券市场151只股票的数据,我们构建了一个股票关系网络,并分析了该网络的拓扑性质。我们的结果表明,所提出的方法能够开发在资产阈值方法类型中保持适当连接的网络。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Multi-Likelihood_Methods_for_Developing_Stock_Relationship_Networks_Using_Financ.pdf (292.45 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:关系网 relationship distribution connectivity Quantitative

沙发
能者818 在职认证  发表于 2022-6-24 05:07:12
一种基于权值的股票相关网络信息过滤算法Xue Guo1,2,Hu Zhang和Tianhai Tian(3,*)武汉纺织大学经济学院、中国统计与数学学院、中南财经政法大学、澳大利亚莫纳什大学中国数学学院、,*通讯作者{snowygx@126.com, zhh11497@sina.com,天海。tian@monash.edu}股票网络的发展是探索大数据时代不同股票之间关系的重要途径。虽然已经设计了许多方法来构建股票相关性网络,但如何平衡显著相关性的选择和网络的连通性仍然是一个挑战。为了解决这个问题,我们提出了一种新的方法来选择股票网络中的要素,并保持已建立网络的连通性。这种方法使用不同的阈值来选择连接到特定股票的边,而不是在现有资产价值方法中使用单一阈值。我们算法的创新之处在于,在选择阈值的最大似然估计中包含了多重分布,而不是现有方法中的单一分布估计。利用中国上海证券市场151只股票的数据,我们构建了一个股票关系网络,并分析了所构建网络的拓扑属性。我们的结果表明,所提出的方法能够开发在资产阈值方法类型中保持适当连接的网络。关键词:互信息、阈值、最大似然估计、Clique1简介复杂系统由大量相互作用的组件组成。通过使用不同节点之间的关系,确定每个节点对其他节点动态的影响非常重要。

藤椅
可人4 在职认证  发表于 2022-6-24 05:07:15
开发各种网络模型已经进行了广泛的应用,如社交网络[1]、生物网络[2]、金融网络[3]和技术网络[4、5、6]。金融市场已被研究为金融网络,其资产定价具有波动的相互依赖性[7]。股票市场就是一个典型的例子,在这个市场中,股票根据国家政策、产业发展、企业业绩和偶然事件相互影响。基于相关性的网络已成为研究股票市场结构的有效方法[3、8、9、10]。股票网络的一些共同特征已经被发现,例如小世界[11、12、13、14]和scalefree[10、15]。根据不同时期拓扑性质的比较,股票市场的效率和不稳定性一直在增长【16】。它在金融危机前后有不同的结构【17】,在金融危机中比在其他时间段具有更集中的拓扑结构【18,19】。此外,股票网络可能容易受到目标攻击,同时可能具有拓扑鲁棒性[20,21]。这些拓扑分析结果在PortfolioOptimization中非常有用【3,22】。由股票价格之间的相关性构建的初始关联网络是一个完整的网络。相关网络的共同目标是从整个相关网络中提取具有代表性的子图,其中包含基本信息。目前,有三种主要方法可以找到关键信息以形成子图,即最小生成树(MST)[23],平面最大过滤图(PMFG)[4,24],以及基于阈值法的资产图[8]。MST通过将n个节点与n个- 1网络中没有任何循环的边。

板凳
可人4 在职认证  发表于 2022-6-24 05:07:18
为了使网络的整体权值保持最小,MST可能会对边缘进行严重的缩减。然而,删除大量边可能会导致丢失有价值的信息[4]。PMFG是嵌入在具有某种亏格的曲面上的图,它决定了图的复杂性。PMFG可以通过增加亏格值来提供更多与循环和团相关的信息,但仍可以从网络中删除一些主要相关性,以保持图平面。与这两种方法相比,阈值图是一种更容易接受的方法,通过添加相关性高于预选阈值的边更容易获得过滤网络[9]。所考虑的网络的复杂性可以通过改变阈值来确定【26】。已经发现,市场上的大多数股票依赖于同一金融部门的少数紧密联系的股票【10】,而阈值图的拓扑结构在正常市场和崩溃市场中都相对稳定【27】。此外,阈值图比MST更早显示集群,并且具有更少的无缩放特性。然而,无论网络结构如何,阈值图都支持最相关的相关性,因为有些节点可能被排除在网络之外。本文的目的是开发一种有效的方法来过滤相关信息,以便从股票同质性的角度观察网络中的集群。由于不同部门的股票可能具有不同的相关性水平,如果对所有相关性应用一个超过阈值的值,一些股票可能会被排除在网络之外。为了解决这个问题,我们提出了一种新的方法,该方法通过使用不同股票内相关性的不同阈值,实现所有股票节点的最优结构。

报纸
可人4 在职认证  发表于 2022-6-24 05:07:21
最大似然估计方法用于确定阈值,该阈值已用于确定选择给定分布样本的切割值【28】。我们最近使用这种方法,根据高斯分布为每个股票选择最佳阈值【29】。然而,我们的研究表明,单一分布不适用于同时具有较小值和较大值的样本模型。在这项工作中,我们提出了一种具有两个分布的极大似然方法来建模具有不同相关性的样本。此外,我们在新方法中进一步引入约束来调整具有密切相关性的边的选择。本文的以下部分介绍如下:第2节介绍了股票之间的数据集和相关性度量。第三节提出了两种新的阈值选择方法,即似然阈值法和约束似然阈值法。在第4节中,我们比较了基于这些方法的股票网络,并研究了这些网络的拓扑属性。第五部分是本文的结论。2数据集2.1样本选择中国上海证券交易所(SSE)由来自不同行业的多家企业组成。在本研究中,我们使用了来自上证180指数的数据集,上证180指数是根据“浮动调整”资本化和其他标准代表前180家公司的股票指数。上证180指数是上证综合指数的一个子指数,上证综合指数包括交易所的所有股票。

地板
大多数88 在职认证  发表于 2022-6-24 05:07:25
上证180指数每半年审查一次,根据公司的财务表现,可以在指数中增加或删除股票。因此,根据2014年至2018年期间数据的完整性,我们研究中使用的样本总共包括151只股票,而不是180只,参考了1157次对每只股票收益率的观察。根据国民经济活动的行业分类,这151只股票被分为13大类,分别是金融业(34只股票)、电力、热力、天然气和水生产和供应业(6只股票)、运输、仓储和邮政服务业(8只股票)、制造业(55只股票)、采矿业(9只股票),房地产(11只股票)、信息传输、软件、信息技术服务(7只股票)、建筑业(8只股票)、批发零售业(8只股票)、文化、体育和娱乐业(2只股票)、农业、林业、畜牧业(1只股票)、复合业(1只股票)、租赁和商业服务业(1只股票)。为了区分其属性,我们在图中用不同的颜色标记节点,这些节点是金融业(FI,红色)、电力、热力、天然气和水生产和供应业(ETGW,棕色)、运输、仓储和邮政服务业(TWP,白色)、制造业(MA,紫色)、采矿业(迷你、灰色)、房地产(RE,黑色)、信息传输、,软件、信息技术服务(IT、蓝色)、建筑业(CO、橙色)、批发和零售贸易业(WR、粉色)、文化、体育和娱乐业(CSE、紫红色)、农业、林业、畜牧业(AFAH、梅花)、复合产业(CI、绿松石)、租赁和商业服务业(LBS、黄色)。

7
大多数88 在职认证  发表于 2022-6-24 05:07:28
为了区分其属性,我们在图中用不同的颜色标记节点,即金融业(FI,红色)、电力、热力、天然气和水生产和供应业(ETGW,棕色)、运输、仓储和邮政服务业(TWP,白色)、制造业(MA,紫色)、采矿业(迷你、灰色)、房地产(RE,黑色)、信息传输、,软件、信息技术服务(IT、蓝色)、建筑业(CO、橙色)、批发和零售贸易业(WR、粉色)、文化、体育和娱乐业(CSE、紫红色)、农业、林业、畜牧业(AFAH、梅花)、复合业(CI、绿松石)、租赁和商业服务业(LBS、黄色)。2.2股票之间相关性的衡量为了组成股票相关性网络,我们从股票组合中每个股票对之间的相互依赖性开始,这种相互依赖性通常由相关系数[3、8、10]和部分相关性[30、16]来量化。该度量主要描述线性关系,不满足实际问题的要求。例如,2014年至2017年,中国股市经历了剧烈波动。在这段时间内,大多数股票价格成倍上涨,随后下降到原始价格,导致股票对之间出现显著的非线性趋势。因此,我们基于熵理论探索了相互信息(MI)来衡量股票之间的非线性关系[31]。多元智能被广泛应用于生物数据分析,它可以解释不同类型的关系,如指数、二次曲线和线性关系。它还被用于量化股票之间的相关性[32]。两种股票的MI估计如下。对数回报率将代替股票价格。

8
kedemingshi 在职认证  发表于 2022-6-24 05:07:31
第t天股票i的对数回报率为i,t=lnpi,tpi,t-1,(t=2,…t;i=1,2,…,n),(1)其中pi,是股票i在t天的收盘价。对于离散变量X,熵H(X)isH(X)=-Xx号∈Xp(x)log p(x)。(2) 其中p(x)是x中每个离散值x的概率。随机变量x和Y的联合熵H(x,Y)可以用H(x,Y)=-Xx号∈十、 y型∈Yp(x,y)log p(x,y)。(3) 其中p(x,y)是x中x和y中y的联合概率。基于这些定义,股票i和j之间的相互信息可以通过i(Si,Sj)=H(Si)+H(Sj)来估计- H(Si,Sj),(i,j=1,2…,n)。(4) 这里,H(Si)是股票i的熵,H(Si,Sj)是股票i和j的联合熵。i(Si,Sj)表示股票i和j共享的公共信息。I(Si,Sj)的结果取[0+∞) 值越大,关系越密切。通常更常用的是归一化MI,定义为asMI(Si,Sj)=I(Si,Sj)H(Si,Sj),(I,j=1,2…,n)。(5) 其中MI∈ [0, 1]. 在开发网络时,将两个股票的距离转换为比亚迪(Si,Sj)=1-I(Si,Sj)H(Si,Sj),(I,j=1,2…,n)。(6) 公式(4)表明,距离越短,相关性越强。对于每对股票,我们可以得到相应的MI和距离。因此,互信息MIn×nand距离Dn×nca的对称矩阵可以分别用公式(3)和(4)来探讨。3方法学3.1传统阈值法传统阈值法的基本思想是选择相关性值最大的最强链接来形成网络。根据公式(4),距离矩阵Dn×nis用于确定某个投资组合中连接n只股票的策略结构。在之前的研究[8,33]中,矩阵Dn×nar中的所有值都按升序{d(1),d(2),···,d(n×(n))排序-1)/2)}.

9
何人来此 在职认证  发表于 2022-6-24 05:07:34
给定阈值d*,这些值分为两部分,距离小于d*将包含在阈值图中。相应地,选定的集合E由值高于某个特定值的链接组成,集合E中的股票对比其他股票对具有更强的关系。该算法描述如下。如上所述,传统的阈值方法侧重于strong表1:算法1阈值算法输入:规范化互信息矩阵MIn×n(或距离矩阵Dn×n),以及节点集VOutput:边集E连接VStep 1中的节点:按MIn×n降序(或Dn×n升序)排序值步骤2:设置阈值η*对于最小×n(或d*对于Dn×n),步骤3:对于i=1:对于j=i+1:如果MI(i,j)>η*(或d(i,j)<d*)添加e(i,j)以设置步骤4的eendifendforends:使用e绘制已建立网络的图形。股票之间的关系和密集集群。因此,一部分链接将被删除,因为相关性的值很小,尽管其中一些对网络也很重要。例如,对于运输、安置和邮政服务部门的一些股票,它们的价格在任何时期都相当稳定,即使在经济繁荣或金融危机的周期中也是如此。这导致该部门与其他部门之间股票对的总体相关性较低。因此,当阈值变大时,股票节点将被排除在网络之外。然而,如果选择一个相对较小的阈值来包括这些股票,则网络将非常密集,很难从网络中获得主要信息。3.2使用多重分布的似然法基于上一小节的讨论,应采用一种措施,不仅解决排除节点的问题,而且还应保持图中的强相关性。

10
mingdashike22 在职认证  发表于 2022-6-24 05:07:37
因此,具有不同相关性水平的不同部门的股票应具有不同的阈值水平,以便将相关性值分为强相关性部分和弱相关性部分。对于每个股票,我们将设置相应的阈值。首先,我们将股票i的MIi,jvalue与所有其他股票按升序排序。然后,应为每个库存节点确定athreshold值,而不是为所有节点确定统一阈值。对于股票节点i,向量Xi=(Xi,1,···,Xi,n-1) 按升序表示MI值。然后我们使用断点u将向量分为两部分,弱相关部分Eweak={xi,1,···,xi,u}和强相关部分Estrong={xi,u+1,···,xi,n-1}. 应将与Estrong相关的节点添加到目标节点集V中,并过滤掉eWak中的链接。然后,问题是如何设置pointu来区分它们。为了解决这个问题,提出了一种使用最大似然估计(MLE)的方法,使用单一分布对这些值进行分类【28,29】。然而,我们的研究结果表明,这种单一分布无法准确计算与强相关性部分相关的可能性【29】。在这里,我们建议使用两种具有不同特征的分布来提供更准确的分类。最佳划分应倾向于使两个分布具有最大的MLE值差异。使用上述符号,最大似然函数定义为asML(u)=log(L((xi,1,···,xi,u)|θ))+(7)log(L((xi,u+1,··,xi,n-1) |θ)),其中Land是两个不同的似然函数,参数θ和θ分别与ewakand和Estrong有关。现在的主要问题是这些分布的选择。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-9 05:33