楼主: nandehutu2022
1152 25

[量化金融] 与金融相关的谷歌搜索中的幂律关联,以及它们的 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-5-7 10:21:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Power-law correlations in finance-related Google searches, and their
  cross-correlations with volatility and traded volume: Evidence from the Dow
  Jones Industrial components》
---
作者:
Ladislav Kristoufek
---
最新提交年份:
2015
---
英文摘要:
  We study power-law correlations properties of the Google search queries for Dow Jones Industrial Average (DJIA) component stocks. Examining the daily data of the searched terms with a combination of the rescaled range and rescaled variance tests together with the detrended fluctuation analysis, we show that the searches are in fact power-law correlated with Hurst exponents between 0.8 and 1.1. The general interest in the DJIA stocks is thus strongly persistent. We further reinvestigate the cross-correlation structure between the searches, traded volume and volatility of the component stocks using the detrended cross-correlation and detrending moving-average cross-correlation coefficients. Contrary to the universal power-law correlations structure of the related Google searches, the results suggest that there is no universal relationship between the online search queries and the analyzed financial measures. Even though we confirm positive correlation for a majority of pairs, there are several pairs with insignificant or even negative correlations. In addition, the correlations vary quite strongly across scales.
---
中文摘要:
我们研究了谷歌搜索道琼斯工业平均指数(DJIA)成份股的幂律相关性。通过结合重标度范围和重标度方差检验以及去趋势波动分析,我们检查了搜索项的每日数据,结果表明,搜索实际上与赫斯特指数在0.8和1.1之间呈幂律相关。因此,对道琼斯工业平均指数股票的普遍兴趣非常持久。我们进一步使用去趋势相关和去趋势移动平均互相关系数重新研究了组成股票的搜索、交易量和波动性之间的互相关结构。与相关谷歌搜索的普遍幂律相关结构相反,结果表明在线搜索查询与分析的财务指标之间不存在普遍关系。尽管我们确认了大多数配对的正相关,但也有一些配对的相关性不显著甚至为负。此外,各尺度之间的相关性差异很大。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
--> Power-law_correlations_in_finance-related_Google_searches,_and_their_cross-corre.pdf (3.2 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:谷歌搜索 correlations Quantitative Applications Econophysics

沙发
大多数88 在职认证  发表于 2022-5-7 10:22:04
简介对互联网用户在线活动的分析已经证明了其在各个学科中的价值,尤其是在心理学[1,2,3,4,5]、生态学[6,7,8,9]、流行病学[10,11,12,13,14]、医学[15,16]语言学[17]、政治学[18]、社会学[19,20]以及广泛的经济学、市场营销和金融[21,22,23,24,25,26,27,28]中,电子邮件地址:kristoufek@icloud.com(Ladislav Kristoufek)预印本于2015年2月3日提交给Physica A[529,30,31,32,33,34,35]。在经济和金融应用中,重点主要放在各种搜索引擎上的搜索查询上,如谷歌、雅虎!还有百度。Bank等人[26]发现了谷歌搜索和德国股市流动性之间的联系。Bordino等人[27]研究了纳斯达克100指数成份股的交易量,他们报告称,这与雅虎的相关搜索有关!发动机Vlastakis&Markellos[28]发现,对纳斯达克和纽约证券交易所股票的互联网搜索查询与其交易量和波动性之间存在正相关关系。Dzielinski[29]引入了基于金融在线搜索查询的不确定性度量。Preiset等人[31]表明,谷歌搜索财务术语可以用于支持交易策略。Kristoufek[32]利用通过谷歌搜索查询衡量的道琼斯股票受欢迎程度来进行投资组合多元化。Kristoufek[33]进一步研究了谷歌搜索、维基百科页面浏览量和比特币加密货币之间的动态关系,发现了它们之间的密切关系。Moat等人[34]报告称,即使是维基百科的页面浏览量也可以用于交易策略的构建。以及Curme等人。

藤椅
kedemingshi 在职认证  发表于 2022-5-7 10:22:07
[35]将在线搜索分为若干组,显示主要以政治和商业为导向的搜索与股市走势有关。在线搜索、交易量和波动性之间最常报告的关系进一步指向在线搜索时间序列的动态特征。由于成交量和波动率的幂律相关结构已经被反复研究[36,37,38],在线搜索也有同样的研究思路。在线活动的潜在长期记忆对建模和正确检查搜索和其他系列之间的动态有进一步的影响。这里,我们研究了与道琼斯工业平均指数(DJIA)相关的谷歌搜索的相关结构。每日谷歌搜索数据用于DJIA的组成部分,因此,我们首次对在线搜索的相关性结构进行了此类研究。为此,我们应用重标范围和重标方差检验来揭示幂律相关性结构,并进一步对搜索查询序列进行去趋势函数分析。事实证明,与谷歌查询相关的数据实际上是幂律相关的,因此我们重新研究了搜索、交易量和所研究股票的波动性之间的交叉相关性。当我们发现在线搜索是幂律相关的,并且处于(非)平稳性边缘时,我们利用了新提出的基于扭曲互相关和去趋势移动平均互相关分析的相关系数。论文的结构如下。

板凳
可人4 在职认证  发表于 2022-5-7 10:22:10
在第2节中,我们描述了所使用的方法,特别是重标范围和重标方差测试、移动区块引导显著性标准、去趋势波动分析以及相关系数。第3节介绍了数据集并给出了结果。第4节结束。我们证明了与幂律相关过程的DJIA分量stocksshow标度特性相关的Google搜索。所有使用的方法都支持这一点。因此,公众对上市公司的普遍兴趣与方差和交易量系列具有相似的性质——在高息期之后是长期低息期。然而,搜索序列总是回归到长期趋势,因此没有观察到爆炸行为。在考虑了在线查询序列的长期记忆方面后,搜索、交易量和波动性之间的相关性变得非常不稳定,没有发现普遍的关系。因此,初步的长期记忆分析对于正确处理在线搜索和各种可能的关联序列之间的相互关系至关重要。2.方法学2。1.长期记忆及其测试长期记忆(或长期依赖性和长期相关性)是通过自相关函数ρ(k)的幂律衰减定义的,其标度为ρ(k)∝ k2H-2对于滞后k→ +∞ [39, 40, 41]. 然后,该序列也被称为幂律(自)相关过程。这类过程的特征参数是赫斯特指数H,或者参数α,对于平稳过程,它的值介于0和1之间。H=0.5的中断值表示没有长期记忆的过程。

报纸
nandehutu2022 在职认证  发表于 2022-5-7 10:22:14
H>0.5的过程通常被称为持续过程,而H<0.5的过程则被称为反持续过程。前者让人想起局部趋势过程,然而,这些过程保持了平稳性(h<1),并足够快地返回其平均值。后者的行为非常不稳定,因为它们比不相关的过程更频繁地改变方向。将平稳的长程相依过程积分一次,就产生了另一类具有有趣性质的过程。一个人≤ H<1.5,我们有非平稳但仍然是均值回复过程。H=1.5的前沿表示单位根过程,H>1.5表示非平稳且非均值回复的过程,即爆炸过程。时间序列的长期记忆特性对时间序列建模和预测具有深远的影响,这主要是因为它包含了一个不可求和的自相关函数[41]。因此,有必要区分具有幂律相关性的长程依赖和具有指数相关性结构的短程依赖。为此,我们采用了修正的标度范围检验和重标度方差检验。修改后的重新缩放范围测试[42]是原始重新缩放范围分析[39]的调整版本。这两种方法都是基于时间序列长度不断增加的重新缩放范围。对于t=1,2。

地板
mingdashike22 在职认证  发表于 2022-5-7 10:22:19
,T,测试统计数据vt定义为vt=RS√Tw其中R是所分析序列的一系列参数,R=maxt=1,。。。,TtXi=1(xi- “x)!- 薄荷=1,。。。,TtXi=1(xi- \'x)!,x是时间序列的平均值,S是原始序列标准偏差的异方差和自相关一致(HAC)估计器,定义为asS=bγ(0)+2qXk=11.-kq+1bγ(k),(1),其中bγ(k)是使用Barlett核权重与滞后k的估计自相关。注意,bγ(0)是一个估计的方差。测试的原始版本和修改版本之间的关键差异源于方程式1,该方程式旨在控制可能的短期记忆偏差。然后,参数q的选择变得至关重要,因为超调参数q甚至可以抑制长期记忆,而欠调参数q可能会导致误导性地发现长期记忆,而长期记忆实际上只是一种很强的短期记忆。我们坚持Lo[42]q提出的参数自动选择标准*=$3T2 | bρ(1)| 1- bρ(1)%(2) 其中,bρ(1)是样本的一阶自相关,bc是较低的整数算子。重标度方差检验[43]基于与前一个非常相似的想法,但顾名思义,它基于的是变量方差,而不是变量范围,因此对极值不太敏感。然后,测试统计MTT定义为asMT=var(X)T,其中var(X)是原始序列的变量。为了控制短期记忆偏差,HAC标准偏差与公式1和最佳q*这里也使用了公式2中的公式。尽管VT和MTA都有明确的渐近临界值[42,43],但由于样本有限,分析序列的非均匀动态以及它们的分布特性,我们选择了另一种方法,利用移动块自举法[44,45]。

7
能者818 在职认证  发表于 2022-5-7 10:22:24
在这个过程中,替代序列是由原始序列中固定大小的块组成的。这样,短期相关性和分布特性得以保持,但长期相关性得以消除,从而在更现实的零假设下创建检验统计量的分布。在我们的应用程序中,我们将块大小乘以25个观察值,并引导1000个替代序列以获得统计意义。2.2. 去趋势函数分析去趋势函数分析(DFA)[46,47,48]是最流行和最常用的赫斯特指数时域估计器。这主要是因为DFA在各种环境下工作,如非平稳性和趋势[48]、周期性周期和季节性[49]以及重尾[50]。该程序基于以下步骤。我们使用t=1的序列{xt}的文件X(t),定义的asX(T)=tXi=1(xi- \'-x)。该文件分为两部分≡ bT/sc长度为s的非重叠窗口,称为刻度。时间序列长度T可能不可被s整除,这将在程序中不使用的序列末尾创建一个问题。为此,这些序列还从序列的末尾分为两个方框,这样我们就可以得到大小为s的两个方框。在每个方框中,我们计算方框内线性时间趋势的均方偏差。这意味着对于第j个大小为s的盒子,我们得到f(j,s)=ssXi=1(X(s[j])- 1] +i)-[Xj(i)),其中[Xj(i)是窗口j中位置i处的时间趋势的线性函数。以类似方式,我们获得了从序列asF(j,s)=ssXi=1(X(t)结尾形成的盒的函数- s[j- Ts]+i)-[Xj(i))。然后,我们构建了一个特定标度s asF(s)=2Ts2TsXj=1[F(j,s)]的函数!最后,我们通过标度律得到赫斯特指数∝ 嘘。

8
nandehutu2022 在职认证  发表于 2022-5-7 10:22:27
(3) 在应用中,我们估计了smin=10和smax=500之间的标度指数≈ T/5。此外,为了更好地说明,我们将估计和结果建立在10到一个小数点的幂的标度s上。然而,请注意,对于天平和盒子分割程序的其他规格,结果不会发生质的变化,因此,这种方法主要用于直接呈现结果。2.3. DCCA和DMCA系数Zebende[51]提出的尺度s的去趋势互相关系数ρDCCA(s)是去趋势波动分析(DFA)[46,47,48]和扭曲互相关分析(DCCA)[52,53,54]的组合。系数定义为ρDCCA(s)=FDCCA(s)FDF A,x(s)FDF A,y(s),其中FDCCA(s)是基于大小为s的窗口的序列{xt}和{yt}之间的去趋势协方差,对于长度为T的窗口,分别是这些独立序列的文件的去趋势方差,序列分为长度为s的非重叠框。在每个框中,计算线性去趋势序列的函数,然后在相同长度的所有框中求平均值。在T不能被s整除的情况下,序列从开始和结束都被整除,平均值基于这些子周期,就像在DFA的情况下一样。有关方法和一些替代规范的更多详细信息,请参见参考资料。[48, 52, 55, 56, 57, 58, 59].Kristoufek[60]引入了尺度λ的去趋势移动平均互相关系数ρDM CA(λ),作为DCCA系数的替代方法。该方法建立在去趋势移动平均(DMA)程序[61,62]和去趋势移动平均互相关分析(DMCA)[63,64]之间的联系之上。

9
能者818 在职认证  发表于 2022-5-7 10:22:32
定义为ρDM CA(λ)=FDM CA(λ)Fx,DM A(λ)Fy,DMA(λ)的系数,其中FDM CA(λ),FDM A,x(λ)和FDM A,y(λ)分别是被检查序列的参数和单独序列的去趋势方差之间的去趋势协方差,带有移动平均参数λ。波动函数基于由长度λ的中心移动平均值去趋势化的序列。不同的规格可用于测试,但中心平均已被证明优于竞争者[65]。与DCCA系数相反,DMCA系数不是基于盒子分裂,因此计算效率更高。更多细节见参考文献。[60, 62, 63].在一系列论文中,Kristoufek[55,60]表明,两种方法的统计特性强烈依赖于单独系列的长期记忆特性。此外,对于所研究过程之间不同程度的相关性,这些方法的可靠性也不是恒定的。为了控制这种影响,我们应用泰勒的振幅调整傅里叶变换(TAAF)[66]。该方法重建的序列具有与原始序列相同的光谱和分布特性。通过这种方法,我们得到了两个具有不变自相关和分布结构的序列,但是它们是成对不相关的。然后可以获得并测试基于ONDCA和DMCA的估计相关性的统计意义。具体地说,对于每一对研究过程,我们得到了TAAF变换序列,该序列没有交叉相关,但保留了原始序列的自相关和分布特性。然后对此类序列的DCCA和DMCA系数进行估计。由于序列没有相互关联,因此系数的预期值为零。然而,估计值的方差可能很高。

10
nandehutu2022 在职认证  发表于 2022-5-7 10:22:36
因此,我们估计了1000个替代序列的系数,以在序列之间无交叉相关性的零假设下获得有限的样本分布,这控制了长期自相关性和分布特性。DCCA是前一节介绍的DFA的二元推广。3.数据和结果谷歌从2004年起提供特定术语的搜索查询时间序列。然而,这一系列的搜索并不是针对某个特定用户的纯搜索数,而是根据谷歌算法进行了重新规范化。谷歌算法本质上可以将搜索重新调整为0-100区间,以便该数字代表特定搜索项在所有搜索项中的比例,即在0到100之间。此外,获得的数字基于所有搜索项的抽样,因此这些项代表估计的重新缩放比例。尽管这样的重新缩放过程可能会在一定程度上稀释该系列的信息内容,但导言部分总结的实验结果却显示了另一种情况。谷歌数据可以每周从谷歌趋势网站(Trends.Google.com)免费下载一次。为了以更高的频率获取数据,尤其是每日数据,需要在三个月的时间段内下载该系列,该系列还需要重新缩放并链接在一起。我们对2004年至2013年期间道琼斯工业平均指数(DJIA)的成份股采用这种程序(除了埃克森美孚、摩根大通和宝洁,其系列短几个月,将在下文中明确),从而获得了大多数系列的2516个观察值。谷歌查询数据最严重的问题是其在定义搜索词时的相对随意性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 21:23