楼主: nandehutu2022
1332 22

[量化金融] 通过非线性研究揭示股票收益率之间的网络 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-6-14 06:39:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Uncovering networks amongst stocks returns by studying nonlinear
  interactions in high frequency data of the Indian Stock Market using mutual
  information》
---
作者:
Charu Sharma and Amber Habib
---
最新提交年份:
2019
---
英文摘要:
  In this paper, we explore the detection of clusters of stocks that are in synergy in the Indian Stock Market and understand their behaviour in different circumstances. We have based our study on high frequency data for the year 2014. This was a year when general elections were held in India, keeping this in mind our data set was divided into 3 subsets, pre-election period: Jan-Feb 2014; election period: Mar-May 2014 and :post-election period: Jun-Dec 2014. On analysing the spectrum of the correlation matrix, quite a few deviations were observed from RMT indicating a correlation across all the stocks. We then used mutual information to capture the non-linearity of the data and compared our results with widely used correlation technique using minimum spanning tree method. With a larger value of power law exponent {\\alpha}, corresponding to distribution of degrees in a network, the nonlinear method of mutual information succeeds in establishing effective network in comparison to the correlation method. Of the two prominent clusters detected by our analysis, one corresponds to the financial sector and another to the energy sector. The financial sector emerged as an isolated, standalone cluster, which remain unaffected even during the election periods.
---
中文摘要:
在这篇论文中,我们探索了在印度股市中发现协同效应的股票集群,并了解它们在不同情况下的行为。我们的研究基于2014年的高频数据。这是印度举行大选的一年,牢记这一点,我们的数据集分为3个子集,选举前阶段:2014年1月至2月;选举期间:2014年3月至5月;选举后期间:2014年6月至12月。在分析相关矩阵的频谱时,观察到与RMT有相当多的偏差,表明所有股票都存在相关性。然后,我们使用互信息来捕获数据的非线性,并将我们的结果与广泛使用的使用最小生成树方法的相关技术进行比较。由于幂律指数{\\alpha}的值较大,对应于网络中的度分布,与相关方法相比,互信息非线性方法成功地建立了有效的网络。在我们的分析中发现的两个显著集群中,一个对应于金融部门,另一个对应于能源部门。金融部门作为一个孤立的、独立的集群出现,即使在选举期间也不受影响。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Uncovering_networks_amongst_stocks_returns_by_studying_nonlinear_interactions_in.pdf (1.41 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:股票收益率 股票收益 非线性 收益率 Econophysics

沙发
何人来此 在职认证  发表于 2022-6-14 06:39:35
标题:利用互信息研究印度股市高频数据中的非线性相互作用,揭示股票回报之间的网络。Charu Sharma1*和Amber Habib1 1印度北方邦Gautam Buddha Nagar Shiv Nadar大学数学系电子邮件Id*:Charu。sharma@snu.edu.电话*:+91-9911750311标题:利用互信息研究印度股市高频数据中的非线性相互作用,揭示股票回报之间的网络。在这篇论文中,我们探索了在印度股市中发现协同效应的股票集群,并了解它们在不同情况下的行为。我们的研究基于2014年的高频数据。这是印度举行大选的一年,牢记这一点,我们的数据集分为3个子集,选举前阶段:2014年1月至2月;选举期间:2014年3月至5月;选举后期间:2014年6月至12月。在分析相关矩阵的频谱时,观察到与RMT有相当多的偏差,表明所有股票都存在相关性。然后,我们使用互信息来捕获数据的非线性,并将我们的结果与广泛使用的使用最小生成树方法的相关技术进行比较。具有较大的幂律指数值, 与相关方法相比,与网络中的度分布相对应,互信息非线性方法成功地建立了有效的网络。在我们的分析中发现的两个显著集群中,一个对应于金融部门,另一个对应于能源部门。金融部门作为一个孤立的、独立的集群出现,即使在选举期间也不受影响。

藤椅
kedemingshi 在职认证  发表于 2022-6-14 06:39:38
关键词:高频数据、随机矩阵理论、互信息、复杂网络、谱图理论AMS分类(MSC2010):05C82、94A15、34L15、34L20简介高频交易是在很短的时间间隔内,在几秒钟内,买卖大量股票。随着计算和技术的进步,如今投资者可以使用算法交易进行此类交易。投资者根据自己的策略编写计算机程序,识别交易机会,并以最少的人为干预执行交易。一个好的交易策略应该能够理解股票的走势,即使是在逐笔交易的情况下。在影响股票价格变化的各种因素中,其他股票价格的变化是最重要的因素之一。多年来,许多研究人员,如Laloux(1999年)、Pan&Sinha(2007年),已经在经验相关矩阵上使用RMT来理解基于每日回报率的股票共同运动。研究了经验相关矩阵的谱,并使用与马尔琴科牧场分布的任何偏差来研究股票之间的相互作用。Pletou(2001)研究了发达国家股票收益的互相关矩阵,后来Pan&Sinha(2007)研究了发达国家和发展中国家,即美国和印度股票收益的互相关矩阵。Pan&Sinha(2007)发现,与美国等发达市场相比,印度等新兴市场在价格变动方面表现出更强的互动性。然而,他们的整个分析是基于股票的每日回报率。在本文中,我们研究了与印度市场相关的相关矩阵的频谱,但现在处于高频水平,时间间隔为30秒。

板凳
能者818 在职认证  发表于 2022-6-14 06:39:41
在不同交易所进行的基于RMT的大多数研究表明,大部分特征值与Marchenko Pastur分布一致,只有少数例外。研究了偏离马尔琴科Pastur分布的大特征值,以了解市场作为一个整体的影响以及部门效应。然而,相关系数是变量之间线性关系的度量。在任何非线性关系的情况下,相关系数可能无法捕捉到这一点,因此与RMT一致的大多数特征值可能是这一点的假象。我们认为,股票之间的相互作用是一种更复杂的现象,因此简单的线性技术可能无法捕获数据的复杂非线性。因此,非常需要开发能够在高频水平捕获股票非线性的方法。互信息就是这样一种度量,它量化了基于相关系数的线性方法可能无法捕捉到的随机变量之间的非线性关系。过去,研究人员在构建生物网络时使用了基于互信息的方法,Song,Langfelder,Horvath(2012),Wang,Huang(2014)。最近,研究人员开始研究基于互信息的股票网络及其拓扑性质,Fiedor P.(2014);Tao,Fiedor,Holda(2015);郭、张、田(2018)。准确估计互信息本身就是一个重要的研究领域,Kraskov,Stogbauer,Grassberger(2004);Cellucci,Albano,Rapp(2005年)。过去,人们提出了各种数值算法来准确有效地估计互信息。Cellucci、Albano、Rapp比较了其中一些算法的效率和准确性。

报纸
mingdashike22 在职认证  发表于 2022-6-14 06:39:44
他们的分析表明,弗雷泽-斯温尼算法在准确性方面是最好的,但需要相当长的时间。自适应划分法所需的计算时间约为Fraser-Swinney所需时间的0.5%,其精度也优于均匀面元法。我们使用自适应分割方法来估计30秒数据上的互信息。论文的剩余部分如下。第2节描述了我们分析中使用的数据。第3节概述了我们分析的方法和方法。在第4节中,我们利用网络的拓扑特征对线性和非线性方法进行了比较研究。在第5节中,我们通过强调分析结果的显著观察结果和解释来总结。数据说明我们从印度国家证券交易所获得了2014年的逐笔数据。对数据进行过滤,以获得当年在CNX100中上市的所有股票。11由于数据值不足或数据缺失,股票从分析中下跌。CNX100指数由Nifty50和CNX Nifty初级股组成。表1和图1给出了组成的详细信息。市场上午9点开门,营业时间至下午4点。交易在前半个小时开始回升,而后半个小时的数据显示出一些模糊性或不完整性。考虑到这一点,我们在分析中使用了上午9:30到下午3:30之间的数据。每30秒的间隔被视为一个滴答声,因此每天我们每只股票有720个滴答声点。

地板
能者818 在职认证  发表于 2022-6-14 06:39:47
对于 股票,我们计算成交量加权平均价格(VWAP), 并使用它查找每30秒返回的日志,                                                          (1) 在这里,是第k只股票的实际交易量 和 股票价格在滴答作响吗 在时间t的30秒窗口内。然后使用公式2计算时间t的日志返回。                                                (2) 此外,我们特别选取2014年进行分析,因为这一年印度举行了大选,ZF发生了变化。我们想分析这一重大事件对网络的影响。为此,我们将数据分为三部分:(a)选举前阶段:2014年1月至2月(b)选举期:2014年3月至5月,(c)选举后阶段:2014年6月至12月。由于宣传集会在3月举行,选举在4月举行,结果宣布在5月举行,因此我们将3月至5月视为选举期。表2总结了数据的详细信息。方法和方法RMT方法关于相关系数矩阵两个随机变量之间的相关系数衡量它们之间线性关系的强度。允许                                            (3)                                 (4)  由方程式(2)给出。然后,我们计算每对股票之间的相关性,并构建相关矩阵 大小 其中 矩阵中的条目表示 库存和 股票

7
mingdashike22 在职认证  发表于 2022-6-14 06:39:50
我们分别在选举前、选举中和选举后的三个时间跨度内进行。在图2中,我们绘制了对应于这3个不同时间跨度的相关系数分布的箱线图。在选举期间,与选举前和选举后相比,更多的对被视为具有更高的相关系数。这一现象很容易理解为一个事实,即市场上有大量的新闻和投机活动,在某种程度上影响着股市。因此,在选举期间观察到高相关系数可能是由于市场效应,这是后来我们分析时确定的 RMT下。相关矩阵的统计特性在文献[]中得到了很好的证明。在大量变量和大量样本点的情况下 是一个随机相关矩阵,其特征值的分布可以很好地用马尔琴科牧场分布来近似。对于大型 和, 即    因此  则随机相关矩阵特征值的概率分布如下所示:           (5) 在哪里 和是的最大和最小特征值 提交人: 和         (6) 偏离此分布的任何偏差都指向拒绝无效假设,即 是随机的。图3给出了本征值的经验PDF和理论PDF的比较. 表3总结了经验和理论分布的统计数据。在所有三个时间跨度内,超过40%的数据被认为偏离了马尔琴科牧场的分布。

8
能者818 在职认证  发表于 2022-6-14 06:39:52
由于与对应于小特征值的特征向量相比,对应于大特征值的特征向量(也称为主分量)携带了有用的信息,因此我们只对偏离RMT的大特征值进行分析。此外,为了证明与RMT的偏差不是因为变量数量有限,89在我们的案例中,我们在随机洗牌每个股票的回报率生成的替代数据上测试了该程序。图4给出了本征值的经验PDF和理论PDF的比较 与测试数据相对应。很明显,测试数据与Marchenko Pastur分布非常匹配,表明原始数据中与此分布的偏差确实是由于股票之间的相关性。互信息方法两个随机变量之间的互信息捕获它们之间的相互依赖。相关系数有助于确定变量之间是否存在线性关系,另一方面互信息有助于测量变量之间的非线性关系。我们坚信,股票之间的相互作用是非线性的,因此使用互信息理解这些相互作用更为合适。在信息论中,香农熵是对随机变量或随机向量的“不确定性”或“不可预测性”的度量。对于离散随机变量 和, 它们的联合熵定义为                       (7) 在哪里 是的联合概率质量函数 和.

9
大多数88 在职认证  发表于 2022-6-14 06:39:55
具有概率质量函数的离散随机变量的熵 定义为                                                (8) 离散随机变量X和Y的互信息定义为                (9) 对连续情况的推广是                                                       (10) Cellucci、Albano、Rapp(2005)对连续随机变量情况下估计互信息的方法进行了比较研究。我们在Fraser-Swinney算法的基础上使用非均匀自适应分割算法来估计互惠信息,因为它在效率和准确性方面都是最好的。基于互信息,两个股票之间的距离 和 定义为           (11) 我们可以检查它是否满足度量的所有属性。最小生成树对于连通图,生成树是一个子图,它连接图中的每个节点,没有圈。对于任何给定的图,可能存在多个生成树。如果将权重分配给每条边,则最小生成树是其边的总权重最小的生成树。为了构建MST股票网络,我们量化了每对股票之间的距离,并将该距离用作每对股票之间的边缘权重。在我们的分析中,我们考虑了两种股票模型,一种基于股票之间的线性关系(使用相关系数),另一种基于线性关系(使用互信息)。对于这两种情况,我们定义了股票对之间距离的度量,等式11和12,并使用它们来构建MST。构造MST有两种著名的模型,Kruskal算法和Prim算法。

10
kedemingshi 在职认证  发表于 2022-6-14 06:39:58
我们在计算中使用了Prim算法。在分析以往网络比较研究方法的基础上,许多研究人员利用股票日收益率的相关系数来了解网络之间的关系。(Mantegna,1999年)。Plerou(2001)和Pan&Sinha(2007)。潘和辛哈在印度股市的背景下研究了每日收益率,他们观察到与美国这样的发达国家相比,两者之间存在着很强的相关性。在他们的研究中,他们观察到大量数据与RMT协同作用,几乎没有表明市场效应的偏差。在我们的分析中,我们以30秒的尺度处理高频数据。在选前、选中和选后期间,RMT的偏差分别约为42%、50%和58%,其中约7%、9%和8%的偏差分别对应于较大的特征值。图5给出了对应于不同时间跨度的三个最大特征值(也称为主分量)的特征向量。与金融部门和IT部门相对应的股票在选举前、选举中和选举后的所有三个时间跨度的第一个特征向量中都优于其他部门。此外,每个部门的股票都很少,这是第一个特征向量的主要贡献者。在选举前,金融部门、IT部门和能源部门成为第二特征向量的主要贡献者。然而,在选举期间和选举后,金融部门和能源部门是第二特征向量的主要贡献者。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 23:12