楼主: 可人4
1156 31

[量化金融] 波尔兹曼学会的美国股市互动网络 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.0443
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-5-8 01:49:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《U.S. stock market interaction network as learned by the Boltzmann
  Machine》
---
作者:
Stanislav S. Borysov and Yasser Roudi and Alexander V. Balatsky
---
最新提交年份:
2015
---
英文摘要:
  We study historical dynamics of joint equilibrium distribution of stock returns in the U.S. stock market using the Boltzmann distribution model being parametrized by external fields and pairwise couplings. Within Boltzmann learning framework for statistical inference, we analyze historical behavior of the parameters inferred using exact and approximate learning algorithms. Since the model and inference methods require use of binary variables, effect of this mapping of continuous returns to the discrete domain is studied. The presented analysis shows that binarization preserves market correlation structure. Properties of distributions of external fields and couplings as well as industry sector clustering structure are studied for different historical dates and moving window sizes. We found that a heavy positive tail in the distribution of couplings is responsible for the sparse market clustering structure. We also show that discrepancies between the model parameters might be used as a precursor of financial instabilities.
---
中文摘要:
我们使用外部场和成对耦合参数化的玻尔兹曼分布模型研究了美国股市中股票收益联合均衡分布的历史动力学。在统计推断的Boltzmann学习框架内,我们分析了使用精确和近似学习算法推断的参数的历史行为。由于模型和推理方法需要使用二元变量,因此研究了连续收益映射到离散域的效果。本文的分析表明,二值化保留了市场相关性结构。研究了不同历史日期和移动窗口大小下的外场分布、耦合特性以及产业集群结构。我们发现,耦合分布中的重正尾是稀疏市场集群结构的原因。我们还表明,模型参数之间的差异可能被用作金融不稳定的前兆。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Adaptation and Self-Organizing Systems        自适应和自组织系统
分类描述:Adaptation, self-organizing systems, statistical physics, fluctuating systems, stochastic processes, interacting particle systems, machine learning
自适应,自组织系统,统计物理,波动系统,随机过程,相互作用粒子系统,机器学习
--

---
PDF下载:
--> U.S._stock_market_interaction_network_as_learned_by_the_Boltzmann_Machine.pdf (4.49 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:美国股市 国股市 distribution Econophysics Quantitative

沙发
可人4 在职认证  发表于 2022-5-8 01:49:26
Boltzmann MachineStanislav S.Borysov,1,2,*Yasser Roudi,1,3和Alexander V.Balatsky1,4 Nordita,KTH皇家理工学院和斯德哥尔摩大学,Roslagstullsbacken 23,SE-106 91斯德哥尔摩,瑞典纳米结构物理,KTH皇家理工学院,Roslagstullsbacken 21,SE-106 91斯德哥尔摩,瑞典卡夫利系统神经科学研究所,NTNU,7030特隆赫姆材料科学研究所,洛斯阿拉莫斯国家实验室,美国新墨西哥州洛斯阿拉莫斯87545(日期:2015年9月10日)我们使用外部场和成对耦合参数化的波尔兹曼分布模型研究美国股市股票收益联合均衡分布的历史动力学。在统计推断的Boltzmann学习框架内,我们分析了使用精确和近似学习算法推断的参数的历史行为。由于模型和推理方法需要使用二元变量,因此研究了连续收益映射到离散域的效果。分析表明,二值化保留了市场相关性结构。针对不同的历史日期和移动窗口,研究了外部场和耦合的分布特性以及工业部门集群结构。我们发现,耦合分布中的重正尾是市场集群结构的原因。我们还表明,模型参数之间的差异可能被用作金融不稳定的前兆。PACS编号:89.65。Gh,02.50。Tt,64.70。克吉。引言金融市场上的价格形成是一个复杂的问题:它反映了投资者对相关资产真实价值、生产者政策、外部监管和许多其他因素的看法。

藤椅
大多数88 在职认证  发表于 2022-5-8 01:49:29
鉴于影响价格的因素很多,其中许多我们都不知道,描述价格形成基本上需要概率方法。在过去几十年中,来自不同科学领域的方法的协同作用为理解相关问题背后的机制开辟了新的视野。一种流行的方法是将金融市场视为一个复杂的系统,在这个系统中,不仅有大量的成分发挥着关键作用,而且它们之间也存在着非平凡的相互作用[1,2]。例如,对复杂金融系统的相关跨学科研究表明,随着内部结构的整体变化,它们对关键事件附近的波动和外部因素的敏感性增强[3–6]。这可以通过致力于平衡[9–12]和非平衡[13,14]相变的研究来补充。一般来说,复杂系统状态空间的统计建模需要使用真实数据记录该空间上的概率分布。在一个简单的建模版本中,由变量向量s描述的可观测配置(系统状态)的概率可以用指数形式P(s)=Z表示-1exp{-βH(s)},(1)*stanislav@smart.mit.edu; 当前地址:新加坡麻省理工学院研究与技术联盟,1 CREATE Way,#09-02,CREATE Tower,138602新加坡,其中H是系统的哈密顿量,β是逆温度(进一步β≡ 假设为1),Z是一个统计和。模型组件的物理意义取决于上下文,例如,在金融系统中,s可以表示股票收益的向量,H可以解释为逆效用函数[15]。通常,H的参数由其在s中的级数展开定义。

板凳
可人4 在职认证  发表于 2022-5-8 01:49:33
基于最大熵原理[16,17],通常使用二次项展开,从而产生成对相互作用模型。在平衡情况下,哈密顿量的形式为H(s)=-h|s- s | Js,(2)其中h是外部电场大小N的向量,Jis是耦合的对称N×N矩阵(|表示串扰)。该模型还可能涉及隐藏状态(节点),这些状态是不可直接观察的,但我们仅限于考虑可见节点。由式(1)表示的基于能量的模型不仅在统计物理中,而且在神经科学(神经网络模型[18,19])和机器学习(也称为玻尔兹曼机器[20])中发挥着重要作用。最近,人们还探讨了成对互动模型在金融市场中的应用[15,21-23]。考虑到神经网络和金融网络[24]之间的拓扑相似性,这些系统可以被视为复杂自适应系统[25]的一个例子,其特点是能够适应不断变化的环境,试图与之保持平衡。从这个角度来看,市场结构属性,例如集群和网络[26–28],对股票价格建模起着重要作用。随着金融和经济系统的发展,这些系统中的适应(或学习)意味着H参数的变化。通过对模型参数进行统计推断,主要目标是建立一个能够根据特定历史时期的时间序列重现统计观测值的模型。在成对情况下,目标ishsiidata=hsiimodel,hsijidata=hsijimodel,(3)其中i=1,N和角括号表示随时间变化的统计平均值。有了特定的通用数学模型,我们还可以讨论金融和内部磁系统在相关现象方面的相似性,例如:。

报纸
可人4 在职认证  发表于 2022-5-8 01:49:37
扩展性、顺序参数和相变等。即使在简化的情况下,当Si是只取两个离散值的二进制变量时,也可以捕捉到这些特征。当值si=+1和si=-1.本文还研究了分别对应的利润和损失。在这种情况下,耦合矩阵的对角元素Jii为零,因为si=1项不影响哈密顿量。值得强调的是,当前的研究发展了先前研究[15,21–23]中概述的想法,以一种更系统的方式研究了二值化、学习算法比较、参数分布的进化和缩放特性的影响。论文的结构如下。第二节介绍了h和J的基本统计定义和推理方法。第三节讨论了股票收益二值化的影响和模型参数的历史演变。最后,第四节第二节总结了我们调查的主要发现。数据和方法我们使用表一所列标准普尔500指数(以下简称标准普尔500指数)中N=71个股票价格时间序列[29]研究美国股市的历史动态。我们分析从1990年到2013年(5828个交易日)的离散日收盘价Si(t),并将其转换为对数回报率srawi(t)=ln[Si(t)/Si(t)- 1)].A.财务时间序列的基本统计分析图1(A)中的顶部面板显示了平均股票回报率的历史数据。为了从时间序列中提取长期趋势,我们采用了一种简单的移动窗口(或简单移动平均,SMA)方法。它就像一个低通滤波器,平均出高频分量,而高频分量通常与噪声有关。

地板
mingdashike22 在职认证  发表于 2022-5-8 01:49:40
在SMA方法中,数据被分成大小为T的块(或窗口),假设时间序列在这个尺度上是平稳的。在这种情况下,tth chunk对应于TFIG。1.原始和二进制平均收益(a)的历史动态及其离散傅里叶变换(b)的振幅。两个标记日期之间的距离为1000个交易日。一些主要的金融危机以浅绿色背景突出显示:(1)1997-1998年的亚洲和俄罗斯危机,(2)网络泡沫,(3)2002年美国股市低迷,(4)美国房地产泡沫,(5)莱曼兄弟破产,随后是全球金融危机,(6)欧洲主权债务危机。每个面板中的数字显示了相应系列之间的总体历史相关性。平均回报率、经济周期和崩溃频率的历史值被保留为二元回报率,尽管最大值是有界的。平均加权的每日日志返回值(包括当前值)。对于每一组块,可以计算出不同的统计特征,例如平均HSII=TT-1Xt=0si(t),(4)和协方差矩阵C(N×N),元素scij=hsisji- Shihsji,(5)其中T≥ 假设协方差矩阵为正定义。下文中,角括号h i表示随时间的平均值(历史值),而条形表示随指数的平均值(向量或矩阵元素)。也可以使用更复杂的统计概念[30]或非线性数据转换来研究时间序列之间的非线性依赖关系,但本文仅考虑了最简单的线性情况。序列方差是自方差,σi≡ Cii,其中σ表示金融中的标准差或波动性。通常,SMA波动率是衡量回报稳定性的最简单风险指标。

7
可人4 在职认证  发表于 2022-5-8 01:49:44
为了量化与正态分布的偏差,定义高阶矩也很有用,例如偏斜度HSKEW(si)i=*硅- hsiiσi+(6) 峰度(也称为超额峰度)hKurt(si)i=D(si- hsii)Eσi- 3,(7)在高斯情况下都等于零。事实上,SMA filter可以提取市场的长期趋势,对于较大的N值,收益分布的不同时刻可以用来识别市场崩溃(图2和图3)。从今往后,我们将把经过考虑的投资组合称为“市场”,因为它代表了标准普尔500指数中的许多顶级公司。此外,我们还使用基本自举算法(替换采样)为这些时刻提供了相应的置信区间,如图所示。2和3。然而,除了移动窗口和相关变量效应[31]之外,还需要对非平稳时间序列的矩估计进行更全面的讨论,考虑金融时间序列固有的非平凡长期记忆效应和日内相关性[32,33],这超出了当前调查的范围。正如引言中所提到的,为了减少我们的推断所需的数据量,我们将重点放在收益的非结构化版本上,而不是原始数据上。因此,我们定义了返回assbini=sign(srawi)的二进制版本。(8) 该程序还减轻了多个系列的缩放问题,因为它独立于绝对值分配相同的股票收益值。处理此问题的另一种常用技术是标准化SSTDI=srawi- hsrawiiσi.(9)在这种情况下,相关矩阵Q(N×N)是一个归一化协方差矩阵,其元素sqij=Cijσiσj。(10)标准化程序已知可保持市场行为,并广泛用于金融时间序列的统计分析[34]。

8
kedemingshi 在职认证  发表于 2022-5-8 01:49:47
这些转变的影响由等式定义。(8) –(10)如图所示。1-3,并将在第三节中进一步讨论,其中比较了二值化收益与原始收益和标准化收益的一些简单统计性质。然而,在此之前,我们简要描述了推理过程。B.平衡玻尔兹曼学习方法利用基于模型似然L(h,J | sdata)最大化的推理方法。在平衡过程中,哈密顿量[Eq.(2)]参数的精确学习意味着以自洽的方式求解方程(3),其中每个学习步骤的校正δhi和δJijon可计算为δhi=ηh(hsiidata)- xiimodel),δJij=ηJ(xisijidata- 西西莫代尔)。(11) 这里,ηhandηJare学习率、h·idata是经验(观察)矩,h·imodel是使用蒙特卡罗(MC)方法从模型中采样的矩。如果系统中没有隐藏节点,精确的学习算法总是会产生h和J的最佳值[35]。由于速度一般较慢,精确的学习算法可能会被近似推理方法[36]所取代,近似推理方法基于系统自由能的扩展,以获得围绕其平均值的小波动。平均场理论(nMF)中的一阶(naive)近似值为-1.- C-1,hnMFi=tanh-1hsii-NPj=1jnmfighsii,(12),其中Aij=(1)- hsii)δij和δij是克罗内克三角洲。在这里,在计算相应的HII时考虑对角元素Jii(通常被丢弃),可以提高近似值的精度,称为对角权重技巧[36]。nMF近似的二阶修正需要求解无思想安德森-帕尔默(TAP)方程C-1.ij=-杰塔皮吉- 2.杰塔皮吉Hsihsji,hTAPi=hnMFi- Hsinpj=1杰塔皮吉1.- 谢,(13) 式中。

9
可人4 在职认证  发表于 2022-5-8 01:49:50
(12) 如果使用了对角重量技巧,则应使用该方法来计算外部场地。另一类近似可以通过成对关联中自由能的展开推导出来。最简单的独立对(IP)近似假定每个股票对与系统其余部分的依赖性。在这种情况下,联结器和外部磁场可以被发现为[19]Jpairij=ln(1+mi+mj+C)*ij)(1)-惯性矩-mj+C*ij)(1)-米+mj-C*ij)(1+mi-乔丹-C*ij),hpairi=ln1+mi1-惯性矩-NPjJpairijmj+Oβ(14) C在哪里*ij=Cij+mimj。Sessak和Monasson(SM)推导了IP近似的高阶修正图。2.平均市场收益(a)分布前四个时间时刻的历史动态。上下:对71只美国股票的原始(sraw,蓝色)、标准化(sstd,绿色)和二元(sbin,红色)回报率,使用250天(大约一个交易年)的SMA窗口计算时间平均值、标准偏差、偏度和峰度(表一)。使用自举算法计算并用灰色虚线表示的SBINAE分布时刻的95%置信区间。每个面板中的数字对应于SSTD和sbin时间序列之间的总体历史相关性。这些整体相关性对移动窗口大小的依赖性如(b)所示。二进制返回的行为类似于原始和标准化返回,但有关峰度的信息完全丢失。图3。使用250天(a)的SMA窗口计算的原始收益的协方差矩阵(Craw,蓝色)和相关矩阵(Qraw,绿色)以及二元收益的协方差矩阵(Cbin,红色)的前四个矩分布的历史动态。上下:矩阵的反对角线元素的平均值、标准偏差、偏度和峰度。

10
kedemingshi 在职认证  发表于 2022-5-8 01:49:53
使用自举算法计算Cbinijare分布时刻的95%置信区间,并用灰色虚线表示。每个面板中的数字对应于QRAW和Cbin时间序列之间的总体历史相关性。这些整体相关性对移动窗口大小的依赖性如(b)所示。二值化使协方差矩阵与原始收益的相关矩阵相似。使用微扰相关展开[37]中的其他项以闭合形式[JSMij=JnMFij+Jpairij]-Cij(1)-mi)(1-(mj)-(Cij),hSMi=hpairi(15)还值得注意的是,已经开发了一些针对不同系统状态的其他近似推理方案,例如使用所有数据的伪最大似然推理[38]、最小概率流量[39]或低温平均场近似[40]。例如,伪最大似然推理[38]更适用于稀疏连接,可以在第III节D.III.结果和讨论a中描述的相关聚类结构的背景下进行研究。二值化的影响公式(8)定义的映射显然会影响时间序列中包含的信息。为了估计这种影响,我们首先比较了平均原始收益和二进制收益的时间序列。如图1所示,Srawan和sbinis历史值之间的相关系数非常高(0.91)。此外,它们的傅里叶变换振幅之间的相关性也很高(0.80),这表明经济周期和市场崩溃频率的特征在二值化时间序列中得以保留。然而,二元收益的最大幅度同样受到定义的限制。使用SMA对过滤后的时间序列进行比较也表明,关于市场趋势的信息保存在二值化时间序列中。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 22:25