楼主: kedemingshi
916 20

[量化金融] 《纽约时报》与 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-6-1 04:06:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Correlations and Flow of Information between The New York Times and
  Stock Markets》
---
作者:
Andr\\\'es Garc\\\'ia-Medina, Leonidas Sandoval Junior, Efra\\\'in Urrutia
  Ba\\~nuelos and A. M. Mart\\\'inez-Arg\\\"uello
---
最新提交年份:
2017
---
英文摘要:
  We use Random Matrix Theory (RMT) and information theory to analyze the correlations and flow of information between 64,939 news from The New York Times and 40 world financial indices during 10 months along the period 2015-2016. The set of news was quantified and transformed into daily polarity time series using tools from sentiment analysis. Results from RMT shows that a common factor lead the world indices and news, and even share the same dynamics. Furthermore, the global correlation structure has found preserved when adding white noise, which indicate that correlations are not due to sample size effects. Likewise, we found a lot of information flowing from news to world indices for specific delay, being of practical interest for trading purpose. Our results suggest a deep relationship between news and world indices, and show a situation where news drive world market movements, giving a new evidence to support behavioral finance as the current economic paradigm.
---
中文摘要:
我们使用随机矩阵理论(RMT)和信息理论分析了2015-2016年10个月期间《纽约时报》64939条新闻与40项世界金融指数之间的相关性和信息流。使用情绪分析工具对新闻集进行量化,并将其转换为每日极性时间序列。RMT的结果表明,一个共同因素引领着世界指数和新闻,甚至具有相同的动态。此外,在添加白噪声时,发现全局相关结构保持不变,这表明相关性不是由于样本大小的影响。同样,我们发现许多信息从新闻流到世界指数都有特定的延迟,这对于交易目的具有实际意义。我们的结果表明,新闻与世界指数之间存在着深刻的关系,并显示了新闻推动世界市场运动的情况,为支持行为金融学作为当前的经济范式提供了新的证据。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--

---
PDF下载:
--> Correlations_and_Flow_of_Information_between_The_New_York_Times_and_Stock_Markets.pdf (3.14 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:纽约时报 correlations Quantitative Econophysics Applications

沙发
能者818 在职认证  发表于 2022-6-1 04:06:20
《纽约时报》和股票市场之间的相关性和信息流。安德烈斯·加西亚-麦地那* 1、Leonidas Sandoval Junior、Efra'n Urrutia Ba'nuelos、andA。M、 马丁内斯·阿尔盖罗物理研究部,索诺拉大学,赫尔莫西罗,索诺拉83000,墨西哥。Insper,Instituto de Ensino e Pesquisa,Rua Quat\'a,300,圣保罗,SP,04546-2400,巴西。贝内姆·埃里塔普埃布拉奥诺马大学(Benem'erita Universidad Aut'onoma de Puebla)西卡研究所,Apartado Postal J-48,Puebla 72570,MexicoJuly 19017Abstracts我们使用随机矩阵理论(RMT)和信息理论分析了2015-2016年10个月期间《纽约时报》64939条新闻与40个世界金融指数之间的相关性和信息流。使用情绪分析工具对这组新闻进行量化,并将其转换为每日极性时间序列。RMT的结果表明,一个共同因素引领世界指数和新闻,甚至具有相同的动态。此外,在添加白噪声时,发现全局相关结构保持不变,这表明相关性不是由于样本大小的影响。同样地,我们发现了大量信息,从新闻到世界指数,都是为了特定的时间,对于交易目的具有实际意义。

藤椅
能者818 在职认证  发表于 2022-6-1 04:06:23
我们的结果表明,新闻与世界指数之间存在着深刻的关系,并显示了新闻推动世界市场运动的情况,为支持行为金融作为当前经济范式提供了新的证据。关键词:随机矩阵理论;传递熵;情绪分析;行为金融。1引言这项工作的目的是在经济物理学[1,2,3]的背景下,理解相对较新的行为金融学派的有效性,并将其与目前大多数金融模型所依赖的最为公认的有效市场假说(EMH)范式进行对比。根据EMH的说法,股票价格立即包含了所有可用的市场信息,其价值不取决于过去的价格[7]。然而,最近一系列的工作已经开始调查文本资源从互联网到市场运动的影响[8、9、10、11、12、13、14、15],展示了从推特、StockTwits、谷歌趋势和一些*通讯作者(andgarm。n@gmail.com)《金融时报》(Financial magazine as Financial Times)提供了可能有助于预测股市变化的早期迹象。这些新结果为公认的有效市场范式提供了强有力的支持,并支持行为经济学的近似理论。然而,上述工作以个人的方式研究了所涉及的时间序列。相反,我们的目的是研究一组金融指标的全局或通用属性,以了解来自《纽约时报》(NYT)的信息是否包含可靠或真实的信息,也就是说,远离噪音,这一问题在我们之前使用推特数据的工作中已得到广泛研究[16]。

板凳
可人4 在职认证  发表于 2022-6-1 04:06:26
除此之外,我们现在有兴趣了解在何种情况下,信息会从纽约时报流向金融指数价格。《纽约时报》是一家在纽约市创办和出版的报纸,在全球195个国家拥有超过百万的印刷品和数字产品订阅量,这使其成为全球最容易访问和发行量最大的报纸之一[17]。为了量化从纽约时报(NYTwe)中提取的新闻,我们使用了情绪分析[18,19],其中基于词典的方法被采用,因为与学习机方法相比,该方法计算成本低,精度高[20]。此外,情绪极性被用作情绪分析指标,因为这一数量可以直接与金融指数的正负变动相关联[9]。另一方面,在投资组合优化的背景下,理解金融市场之间的相关性结构并将其与噪音区分开来是非常有意义的【21】。理解这种相关性的一种新方法来自随机矩阵理论(RMT)。从历史上看,许多理论物理现象已经通过RMT成功地解决了[22、23、24、25、26],并且在过去几年中出现了大量的金融应用[27、28、29、30、31、32、33、34、35、36]。尽管相关性研究有助于确定哪些资产的行为相似,但仅使用相关性度量,我们无法建立金融指数之间的因果关系或影响,因为一个变量对另一个变量的作用不一定是对称的[37]。测量因果现象的一个非常有用的量有信息论的基础,它被称为传递熵。

报纸
mingdashike22 在职认证  发表于 2022-6-1 04:06:28
传递熵或传递信息是一种动态的非对称度量,最初由Schreiber【38】提出,并基于汉农熵的概念【39】。该度量旨在通过检测两个进程之间的交互不对称来确定两个进程之间传输信息的方向性【38,40】。传递熵被用来解决许多问题。它在研究大脑神经皮层【41、42、43、44】、社交网络【45】、金融【46、47、48、37】、统计物理【49】和动态系统【50】中都很有用,并在【51】中得到了热力学解释。在这项工作中,我们使用RMT和传递熵来发现新闻是否推动了市场运动,并显示更多支持行为金融的反EMH证据。具体而言,我们分析了2015-2016年10个月期间《纽约时报》64939条新闻与40个世界金融指数之间的相关性和信息流。本文的组织结构如下。第2节描述了brie fly the analyzeddata、从《纽约时报》中提取新闻的方法,以及如何使用情绪分析构建极性时间序列。第3节包含通过RMT进行相关性分析的主要结果。第4节显示了通过传递熵得到的流量信息结果。最后,第5节给出了工作的结论。2分析数据我们考虑了一组来自纽约时报的64939条新闻和全球40个国家的每日收盘价,这些数据是在2015年7月1日至2016年5月1日这段时间内获得的,对应于217个交易日。这组新闻是针对表1中列出的每个国家提取的。表1还列出了相关世界金融指数的彭博符号。

地板
nandehutu2022 在职认证  发表于 2022-6-1 04:06:32
新闻提取是在协调世界时(UTC)进行的,而收盘价的时间要求因股票市场交易的时区而异。新闻是通过《纽约时报》的接口文章搜索API提取的,该API使我们能够以结构化的方式访问其数据库。为了消除提取文本中由于非字母数字字符而产生的噪声,我们借助PYTHON的自然语言工具包(NLTK)对其进行了预处理。去除噪音后,我们使用价感知词典和情感推理器(VADER)对清理后的文本进行情感分析,这是一个实施句法和语法规则的词典,结合经验得出的量词,以考虑分析文本中存在的情感强度,从非常消极的单词到非常积极的单词,词汇的每个元素都在-4到4之间。维德已被调整为捕捉社交网络中表达的情感,但也显示出捕捉《纽约时报》文本情感的出色效果【20】。最后,我们取给定文本中所有得分的平均值(每个单词一分),并将该平均值与文本的情感极性(积极或消极)联系起来[16,9]。然后,我们将给定关键字k在给定日期t对应的所有新闻的极性时间序列命名为Pk(t)。3随机矩阵理论分析3.1预备知识让Sk(t)表示指数k在第t天的每日收盘价。每个指数k(k=1,…,N)在t=1,T(以天为单位)由k(T)=Sk(T+t)- Sk(t)Sk(t)。(1) 我们选择一个交易日的回报区间,以便t=1。为了将我们的数据与RMT的通用结果进行比较,对极性和返回时间序列进行了归一化。

7
何人来此 在职认证  发表于 2022-6-1 04:06:35
指数k时间t的各自标准化回报率定义为Rk(t)=(Rk(t)- hRki)/σk,(2)表1:本研究分析的财务数据列表。第一栏:指数交易的国家;第二栏:彭博财经指数;第三栏:关键字搜索纽约时报的文章搜索API。彭博资讯国家/地区股票代码NYT关键字美国SPX美国Scanada SPTSX加拿大墨西哥哥伦比亚IGBC哥伦比亚委内瑞拉IBVC委内瑞拉IPSA ChileArgentina MERVAL ArgentinaBrazil IBOV BrazilNigeria NGSEINDX Nigeria英国UKX Englandrance CAC FranceBelgium BEL20 BelgiumItaly FTSEMIB ItalySwitzerland SMI SwitzerlandNetherlands AEX NetherlandsDenmark KFX Denmark NorwayOBX NorwaySweden OMX Sweden GermanyPoland WIG PolandAustria ATX AustraliagreceHungary BUX HungaryUkraine PFTS UkraineRussia INDEXCM Russia Turkey XU100 TurkeyEgypt CASE Egypt Israel TA-25 Israelab SASEIDX ArabiaPakistan KSE100 Pakistanidia SENSEX Indiandonesia JCI IndonesiaMalaysia FBMKLCI Malaysiangapore FSSTI SingaporeChina SHCOMP China Hong HSI Hong TaiwanTWSE TaiwanSouth KOSPI South KoreaJapan NKY JapanAustralia AS51 Australia4 2 0 2 4x0.00.20.40.60.81.0ρ(x)正态分布(a=4.67)极性回归图1:收益、极性的分布,以及参数a=4.67的归一化高斯分布和student-t分布,最适合回归分布。式中σkis是Rk的标准偏差,h。i表示研究期间的平均时间。平均极性以相同的方式进行归一化,并表示为时间t时指数k的pk(t)。在图1中,我们绘制了回报、极性以及正态分布和student-t分布的分布,参数a=4.67,最适合回报分布。

8
kedemingshi 在职认证  发表于 2022-6-1 04:06:38
众所周知,收益率分布的尾部通常比正态分布的尾部重[1],并且更好地用student-t分布来表征,我们可以在相同的图1中观察到这种行为。相反,可以看到极性分布呈倾斜形状,这排除了返回数据的对称行为。3.2 Wishart集成:被定义和标准化时间序列之间的相关矩阵元素xkand xl由c(x)k给出,l=hxk(t)xl(t)i,(3)其中x表示我们正在研究的时间序列的类型,因此c(p)k,land c(r)k,lar分别是由极性和反转时间序列构造的矩阵相关元素。设为一个N×T矩阵,其矩阵元素是具有零均值和等方差的统计独立高斯变量。然后,矩阵xh=W W+在RMT的形式中被称为Wishart矩阵,在Haar测度下的一组矩阵被称为Wishart集合(WE)[22]。通过构造,这些矩阵由N个长度为T的不相关时间序列组成。H的N个特征值,表示为λ,λ,λN是非负的,其联合概率密度函数由[52]P[{λi}]=CN,Texp”给出-βNXiλi#NYi=1λαβ/2iYj<k |λj- λk |β,(4),其中α=(1+T- N)- 2β和归一化常数CN,Tcan可精确计算[53]。我们可以假设N≤ T,因为如果N≥ T,1可以表示N- T特征值正好为0,其余T特征值的分布与上面的表达式完全相同,N和T交换。极限N,T中β=1(实对称情形)的解→ ∞, Q=电话号码(≥ 1) ,由Marˇcentko Pastur定律[54]ρ(λ)=Q2πσp(λ)给出+- λ)(λ - λ-)λ、 (5)在λ范围内-≤ λ ≤ λ+和0,否则。WE中随机矩阵的最小(最大)特征值由[54]给出:λ+-= σ(1+1/Q±2p1/Q)。

9
mingdashike22 在职认证  发表于 2022-6-1 04:06:41
(6) 这些预测在RMT领域被称为Wishart矩阵的普遍结果,并构成了财务指数(或极性)之间无相关性的零假设。如果金融指数(或极性)之间没有相关性,则特征值应在RMT预测之间有界[27,28]。在图2中,我们绘制了经验相关矩阵C(r)和C(p)的特征值分布,其中叠加了Marˇcentko Pastur定律。此处尺寸为N×T=40×217,参数Q=T/N=5.425。我们清楚地看到,两个相关矩阵的一些特征值远离噪声区的上界,这提供了有关整个研究国家的相关行为的信息,并暗示存在真正的相关性。我们将在下一节中详细讨论最大特征值和相应的最大特征向量。3.3特征向量和时间分析在金融中,与最大特征值相关的特征向量的所有成分都是正的,这一事实反映了一种常见的金融市场模式,并且与投资组合中风险最大的资产组合有关。相反,与最小特征值相关的特征向量对应风险较小的投资组合。这两个特征向量不是变量的随机组合【55】。在图(3)中,我们绘制了与经验相关矩阵的最大和最小特征值相关的特征向量。我们可以在图3(a)中看到,与较大特征值相关的特征向量的所有分量均为正且远离零,而在图3(b)中,0 5 10 15 20 25λ0.00.20.40.60.81.01.21.4ρ(λ)Marcenko PasturPolarityReturn的大部分分量图2:相关矩阵的特征值分布。我们用黑线表示马尔岑科Pastur定律。

10
何人来此 在职认证  发表于 2022-6-1 04:06:44
蓝线代表极性的结果,绿线代表回报。与最小特征值相关的特征向量接近于零,只有少数特征突出。这两种情况的表现都符合预期[55]。有趣的是,如果我们更仔细地分析图3(b),它告诉我们,如果我们考虑极性数据的构建,风险较小的港口必须包括美国和中国,如果我们考虑回报数据,也必须包括法国和荷兰。我们之所以这样认为,是因为这些分量的大小比其他分量大,并且是与最小特征值相关的特征向量中最具代表性的。为了进行时间分析,我们从四个交易月(Ts=160天)的滑动窗口中构建了一组样本相关矩阵,再加上一个交易日的重叠。然后,我们得到了两组M=58样本相关矩阵,一组来自极性值,另一组来自返回值。这些集合中的每个相关矩阵现在都有一个维数N×Ts=40×160,参数Q=Ts/N=4。因此,上下理论界为λ-= 0.25和λ+=2.25,对于噪声引起的大部分特征值分布。众所周知,对于大尺寸的C,最大特征值λmax(t)的时间演化与平均相关系数C(t)=hC(t)iij密切相关【56,57】。在图4中,我们为我们的经验数据绘制了这些数量。尽管经验数据的维数太小,但发现λmax(t)和'c(t)之间存在很强的相关性,Pearson Pc和Spearman Sc的相关系数【58,59】在极性和回归值方面均大于0.97。然后,λmax(t)和'c(t)共享相同的动力学。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 14:36