楼主: kedemingshi
401 22

[量化金融] 结合社会和经济因素预测未来股市结构 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
87.4399
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24714 点
帖子
4141
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Predicting future stock market structure by combining social and
  financial network information》
---
作者:
Th\\\'arsis T. P. Souza and Tomaso Aste
---
最新提交年份:
2018
---
英文摘要:
  We demonstrate that future market correlation structure can be predicted with high out-of-sample accuracy using a multiplex network approach that combines information from social media and financial data. Market structure is measured by quantifying the co-movement of asset prices returns, while social structure is measured as the co-movement of social media opinion on those same assets. Predictions are obtained with a simple model that uses link persistence and link formation by triadic closure across both financial and social media layers. Results demonstrate that the proposed model can predict future market structure with up to a 40\\% out-of-sample performance improvement compared to a benchmark model that assumes a time-invariant financial correlation structure. Social media information leads to improved models for all settings tested, particularly in the long-term prediction of financial market structure. Surprisingly, financial market structure exhibited higher predictability than social opinion structure.
---
中文摘要:
我们证明,未来的市场相关性结构可以通过综合社交媒体和金融数据信息的多重网络方法进行预测,具有很高的样本外精确度。市场结构是通过量化资产价格收益的联动来衡量的,而社会结构是通过社交媒体对这些相同资产的意见的联动来衡量的。预测是通过一个简单的模型得出的,该模型通过金融和社交媒体层面的三元闭合来使用链接持久性和链接形成。结果表明,与假设财务关联结构时不变的基准模型相比,该模型可以预测未来市场结构,样本外绩效提高了40%。社交媒体信息可以改进所有测试环境的模型,尤其是在金融市场结构的长期预测方面。令人惊讶的是,金融市场结构表现出比社会舆论结构更高的可预测性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Predicting_future_stock_market_structure_by_combining_social_and_financial_netwo.pdf (1.35 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:预测未来 social media Quantitative Applications Econophysics

沙发
kedemingshi 在职认证  发表于 2022-6-11 05:48:33 |只看作者 |坛友微信交流群
结合社会和金融网络信息预测未来股市结构,*, Tomaso AsteaaDepartment of Computer Science,UCL,Gower Street,London,WC1E 6BT,UK Abstracts我们证明,未来的市场相关性结构可以通过结合社交媒体信息和金融数据的多重网络方法进行预测,具有很高的样本外精确度。市场结构是通过量化资产价格收益的协同运动来衡量的,而社会结构是通过社交媒体对这些相同资产的观点的协同运动来衡量的。预测是通过一个简单的模型得出的,该模型通过金融和社交媒体层面的三元闭合,使用链接持续性和链接形成。结果表明,与假设时间不变财务相关性结构的基准模型相比,提出的模型可以预测未来市场结构,样本外绩效提高高达40%。社交媒体信息可以改进所有测试环境的模型,尤其是在金融市场结构的长期预测方面。令人惊讶的是,金融市场结构表现出比社会意见结构更高的可预测性。关键词:金融网络;网络链路预测;相关结构预测;信息过滤网络;基于相关性的网络;社交媒体1。简介金融市场可以被视为一个复杂的网络,其中节点代表不同的金融资产,边缘代表这些资产之间的一种或多种关系。文献中已成功使用基于过滤相关的网络来研究金融市场结构,尤其是从经验金融时间序列得出的观测数据[1、2、3、4、5]。

使用道具

藤椅
kedemingshi 在职认证  发表于 2022-6-11 05:48:36 |只看作者 |坛友微信交流群
其基本原理是利用经验金融时间序列的相关性构建一个稀疏网络,代表最相关的联系。用于信息提取的过滤相关网络分析[6、7、3]已广泛用于解释市场互联性*对应的authorEmail地址:T。Souza@ucl.ac.uk(Th’arsis T.P.Souza)2018年12月5日从高维数据提交给Elsevier的预印本。应用包括资产配置【8】、市场稳定性评估【9】、层次结构分析【2、3、4、10、11】以及超前-滞后关系的识别【12】。迄今为止,大多数文献都集中在金融时间序列的分析上。然而,近年来,大量有关金融市场的信息已从社交媒体等外部来源获得。可以合理地认为,社交媒体情绪的变化[13]和资产价格的变化可能是相关的。之前的一些研究表明,关系的存在在某些情况下表明,社交媒体可以用来预测资产价格的变化[14、15、16、17、18、19]。当新信息进入市场时,投资者可能会做出理性或非理性的反应[20,21]。他们可能会在社交媒体上发表意见,这些意见后来会成为市场行为,从而有机会预测未来的资产价格。然而,也有人强调,并非所有资产的行为方式都相同。

使用道具

板凳
kedemingshi 在职认证  发表于 2022-6-11 05:48:39 |只看作者 |坛友微信交流群
一些人更受社交媒体情绪的影响,而另一些人则相反,更受社交媒体情绪的影响【22】。除了每个单一金融资产外,我们在本研究中还探讨了实体库存市场结构是否与社会媒体情绪构建的结构相关,以及是否存在可用于预测一种结构与另一种结构的超前-滞后关系。我们使用滚动窗口上计算的动态Kendall相关性来研究由股市价格和推特情绪信号构建的基于过滤相关性的网络所代表的市场结构的时间演化。我们生成了两个网络:一个来自股票价格的日志回报,另一个来自推特情绪。这两个网络被视为多层问题,其中两层网络共享相同的节点,但具有不同的边集。我们调查通过将过去的财务信息与过去的社交媒体情绪信息相结合,是否可以更好地预测金融市场结构。市场结构预测问题是一个链接预测问题,我们根据过去金融和社会网络结构的信息,估计未来添加或删除链接的可能性。2、方法2.1。金融和社会网络我们从2012年5月9日至2017年8月25日期间纳入标准普尔500指数的100家资本化程度最高的公司中选出了N家。这些公司的股票代码列表见附录A.1。对于每个股票i,财务变量定义为每日股票的对数回报Ri(τ)=对数P价格(τ)-对数P大米(τ- 1) ,其中P rice(τ)表示时间τ的收盘价。

使用道具

报纸
能者818 在职认证  发表于 2022-6-11 05:48:42 |只看作者 |坛友微信交流群
社交媒体变量定义为社交媒体对股票i的看法,其估计为时间τ时与股票i相关的每日推文看涨总数。推特情绪数据由PsychSignal提供。com[23]。在该数据集中,当提到股票代码时,推特消息被定义为与给定股票相关。该数据集仅使用英语语言内容,并且与推特消息的国家来源无关。我们提供了相关文献中使用的Twitter情绪数据集的进一步描述性分析[14,22]。股票回报率和社交媒体意见得分总计相当于1251个交易日的时间序列。这些序列按时间顺序分为M=225个窗口t=1,2,宽度M T=126个交易日。δT=5个交易日的窗口步长参数定义了窗口的位移,即两个连续窗口之间的交易日数。窗口宽度T和窗口步长δT的选择是任意的,这是在分析过于动态或过于平滑之间进行权衡的结果。窗口宽度越小,窗口步长越大,数据越动态。为了描述资产的同步时间演化,我们使用资产i和j之间的等时肯德尔秩系数,定义为ρi,j(t)=Xt<τsgn(Vi(t)- Vi(τ))sgn(Vj(t)- Vj(τ)),(1)其中tandτ是窗口t和Vi内的时间索引∈ {Ri,Oi}。Kendall的秩系数满足条件-1.≤ ρi,j≤ 1并形成N×N相关矩阵C(t),作为本文构建网络的基础。为了构建基于资产的金融和社会网络,我们定义了一对股票之间的距离。这一距离与连接股票的边缘有关,它反映了它们的相关水平。

使用道具

地板
mingdashike22 在职认证  发表于 2022-6-11 05:48:45 |只看作者 |坛友微信交流群
我们使用了一个简单的非线性变换di,j(t)=p2(1- ρi,j(t))以获得性质为2的距离≥ di,j≥ 0,形成×N对称距离矩阵D(t)。我们提取了N(N- 1) /2距离矩阵D(t)上三角部分的不同距离元素,然后按升序排序,形成有序序列D(t),D(t),dN(N-1) /2(t)。因为我们要求图表代表市场,所以很自然地只包含最强的连接来构建网络。这是一种网络过滤程序,已成功应用于构建资产图以分析市场结构[24,25]。要包含的边的数目是任意的,我们包含了来自底部四分位的边,它们代表了图中25%的最短边(最大相关),因此给出了(t)={d(t),d(t),…,dbN/4c(t)}。我们将EF(t)和ES(t)分别表示为从股票收益率R(t)和社交媒体观点O(t)导出的距离矩阵构造的边集。两个网络被视为双重结构的两层g={GF,GS},其中GF=(V,EF),GS=(V,ES),V是两层共有的顶点集。2.2. 持久性在时间t时,金融层中顶点u和v之间的边的状态用相应的邻接矩阵元素EFu,v(t)表示:EFu,v(t)=1的二元变量,表示边的存在和否,v(t)=0。类似地,变量ESu,v(t)解释了社会(S)层中边缘(u,v)的存在或不存在。变量Eu,v(t)=EFu,v(t)∨ ESu,v(t)=1表示两层中Nu和v之间至少存在一条边;Eu,v(t)=0表示任何层中的u和v之间不存在任何边。2.3.

使用道具

7
nandehutu2022 在职认证  发表于 2022-6-11 05:48:49 |只看作者 |坛友微信交流群
三元ClosureLet Nuvbe是顶点u和v的共同邻接节点集。我们定义了F层边(u,v)的三元闭包TFu,v(t)和时间t,作为Nuv中顶点聚类系数的平均值:TFu,v(t)=Nuv | Xi∈NuvCFi(t),(2)式中,术语cfi是节点i的聚类系数,它解释了三角形中闭合的i的邻居中三元组的分离。定义为asCFi=2个顶点位于iki(ki)上的三角形数- 1) =Pj,k∈NiEFj,kki(ki- 1) ,(3)其中Ki是顶点i的阶数,Ni是顶点i的邻域。在多重情况下,我们保持相同的定义,但允许三角形跨多个层形成【26,27】。对于多路复用情况,我们使用symbolTu,v(t)。A) 财务层FB)财务层FSocial层SFigure 1:单层网络(面板A)和多路网络(面板B)上的三元组。节点i的聚类系数说明了i邻域中三角形闭合的三元组的比例。F层边(u,v)的三元闭包是顶点u和v的公共邻域的聚类系数的函数。三角形可以在单层中形成,也可以跨层形成。2.4. 链接预测我们的目标是通过使用以前时间t的金融和社会网络的过去结构信息,预测未来时间t+h在金融网络GF(t+h)中插入或删除边缘的概率≤ t、 为此,我们考虑了两种机制:1)以前存在的边缘在将来持续存在的趋势(边缘持续性);2) 层内或层间三角形闭合的倾向(三元闭合)。三元闭包的增长机制基于传递性原则,在现实网络中经常观察到,在现实网络中有形成三角形的趋势。

使用道具

8
大多数88 在职认证  发表于 2022-6-11 05:48:52 |只看作者 |坛友微信交流群
根据这一原则,如果两个节点共享具有高传递性的公共邻居,即倾向于闭合三角形,则它们往往是连接的。通过边缘持续性和三元闭合系数的逻辑回归,计算未来插入边缘的概率。我们通过对培训集进行最佳拟合来估计回归系数,该培训集由126个交易日的滚动窗口组成,初始范围为2012年5月9日至2014年10月9日。在培训结束后的h=1至h=20周,对财务网络中的边缘存在情况进行预测。测试集最初范围为2014年9月17日至2017年8月25日。将训练窗口向前移动1周,重复该过程。观察由边att+h连接的顶点u,v的概率pu,v(t+h)可以根据之前的三元闭合系数Tu,v(t)和边持久性得分Eu,v(t)来推断。我们首先考虑了一个仅使用财务信息的受限模型,该模型如下所示:logpFu,v(t+h)1- pFu,v(t+h)=βh+~βhTFu,v(t)+~γhEFu,v(t)。(4) 对于这个受限模型,我们对h∈(1、2、…、19、20)周。为了校准公式4中的参数,我们考虑了一个训练窗口,即W=126天,结束于时间t。公式4中逻辑模型训练窗口上的对数似然函数[28]由f(t)=tXt=t给出-W+1Xuv∈EF(t+h)- 对数(1+eβh+βhTFu,v(t)+γhEFu,v(t))+tXt=t-W+1Xuv∈EF(t+h)(1- EFuv(t+h))(▄βh+▄βhTFu,v(t)+▄γhEFu,v(t))。(5) 我们对等式5给出的对数似然函数进行了区分,以确定等式系数的最大对数似然估计。

使用道具

9
大多数88 在职认证  发表于 2022-6-11 05:48:55 |只看作者 |坛友微信交流群
4、为了验证多重信息在预测金融网络中的链接时是否与过去单独的金融网络相比相关,我们考虑了一个完整的回归模型,该模型从金融层(TFu、v(t)、EFu、v(t))、社会层(TSu、v(t)、ESu、v(t))和多重网络(TFu、v(t)、EFu、,v(t))。全模型islogpu,v(t+h)1- pu,v(t+h)=βh+βhTFu,v(t)+βhEFu,v(t)+γhTSu,v(t)+γhESu,v(t)+θhTu,v(t)+θhEu,v(t)。(6) 等式6中完整模型的对数似然函数L(t)和模型拟合可以通过与等式4中受限模型之前执行的程序类似的方式获得。似然比统计量为λ(t)=-2(Lmax(t)- LFmax(t)),(7),其中Lmax(t)和LFmax(t)分别是训练集窗口中完整模型和受限模型的对数似然函数的最大值。假设相似比统计量λ(t)遵循4个自由度的χ分布[28],其中λ>18.47的值在p=0.001时被假设为统计显著性。在这种情况下,有证据表明,与只考虑财务信息的受限模型相比,可以接受考虑社会和财务信息的完整模型。通过计算真正(预测存在且确实存在于未来网络中的边缘)和假正(预测存在但不存在于未来网络中的边缘)以及测量最初范围为2014年9月17日至2017年8月25日的测试集中的AUC(接收器工作特性曲线下的面积),估计模型性能。AUC范围从0.50到1.00,数值越高,表明模型在存在边缘和不存在边缘这两类之间的区别越好。3、结果3.1。

使用道具

10
nandehutu2022 在职认证  发表于 2022-6-11 05:48:58 |只看作者 |坛友微信交流群
市场结构动态我们首先通过比较时间t的金融网络GF(t)和未来的金融网络GF(t+h)在h阶头来研究金融网络的持续性。为了量化相关网络结构的变化,我们使用了两个度量:A)GF(t+h)中不存在的新边的分数;B) Jaccard距离,定义为Jaccard(GF(t),GF(t))=kGF(t)∩ GF(t)KGF(t)∪ GF(t)k。结果分别在图2面板A)和B)中报告。图2:财务相关性结构随时间发生显著变化的证据。面板A)显示了时间t+h时金融网络中新边缘相对于时间t(1)时边缘集的平均百分比≤ h类≤ 20个交易周)。我们观察到,在h=20个交易周后,金融网络中几乎40%的边缘发生了显著变化。面板B)显示了金融网络之间的交叉相似性,以2012年5月9日至2017年2月21日期间GF(t)和GF(t)之间的Jaccard距离为衡量标准。我们观察到,随着时间的推移,边缘变化(持久性)是相当稳定的,也就是说,整个时期内变化的边缘数量是相似的。网络GF(t)在每个时间t根据从时间t开始的126个交易日的滑动窗口估计的相关结构构建。窗口随时间步长1交易周移动。面板A)中的误差条表示标准误差。图2面板A)显示了时间t+h时金融网络中新边缘相对于时间t(1)时边缘集的平均百分比≤ h类≤ 20个交易周)。我们观察到,金融网络中的边缘发生了显著变化,在h=20个交易周后,金融网络中近40%的边缘发生了变化。无花果

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-9 07:58