楼主: 大多数88
703 16

[量化金融] 利用谷歌量化股市宏观经济预期 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
71.3197
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-10 01:34:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Quantifying macroeconomic expectations in stock markets using Google
  Trends》
---
作者:
Johannes Bock
---
最新提交年份:
2018
---
英文摘要:
  Among other macroeconomic indicators, the monthly release of U.S. unemployment rate figures in the Employment Situation report by the U.S. Bureau of Labour Statistics gets a lot of media attention and strongly affects the stock markets. I investigate whether a profitable investment strategy can be constructed by predicting the likely changes in U.S. unemployment before the official news release using Google query volumes for related search terms. I find that massive new data sources of human interaction with the Internet not only improves U.S. unemployment rate predictability, but can also enhance market timing of trading strategies when considered jointly with macroeconomic data. My results illustrate the potential of combining extensive behavioural data sets with economic data to anticipate investor expectations and stock market moves.
---
中文摘要:
在其他宏观经济指标中,美国劳工统计局(U.S.Bureau of Labour Statistics)在《就业形势报告》中每月公布的美国失业率数据引起了媒体的广泛关注,并对股市产生了重大影响。我调查是否可以通过在官方新闻发布前使用谷歌相关搜索词的查询量预测美国失业率的可能变化来构建一个有利可图的投资战略。我发现,人类与互联网互动的大量新数据源不仅提高了美国失业率的可预测性,而且在与宏观经济数据结合考虑时,还可以提高交易策略的市场时机。我的研究结果表明,将广泛的行为数据集与经济数据相结合,可以预测投资者的预期和股市走势。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Quantifying_macroeconomic_expectations_in_stock_markets_using_Google_Trends.pdf (779.87 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:宏观经济 unemployment R statistics Quantitative Expectations

沙发
能者818 在职认证  发表于 2022-6-10 01:34:25
使用谷歌趋势量化股票市场的宏观经济预期Johannes Bock英国考文垂CV4 7AL沃里克大学沃里克商学院金融系,电子邮件:j。bock@warwick.ac.uk2018年5月摘要在其他宏观经济指标中,美国劳工统计局在《就业形势报告》中每月发布的美国失业率数据引起了媒体的广泛关注,并对股市产生了强烈影响。我调查是否可以通过在官方新闻发布前使用谷歌相关搜索词的查询量预测美国失业率的可能变化来构建一个有利可图的投资战略。我发现,人类与互联网互动的大量新数据源不仅提高了美国失业率的可预测性,而且在与宏观经济数据结合考虑时,还可以提高交易策略的市场时机。我的研究结果表明,将广泛的行为数据集与经济数据相结合,可以预测投资者的预期和股市走势。2导言在线数据可能为经济学家、研究人员和投资者提供新的机会,在消费者调查或官方数据等更传统且往往是回顾性的来源之前,调查和观察行为的变化。及时的基于互联网的搜索数据有助于“对大规模集体决策的不同阶段提供新的见解”(Preis等人,2013年,第5页),并可用于分析人们的信仰、担忧和偏好,最终改善对未来行为的预测(Ettredge等人,2005年)。

藤椅
何人来此 在职认证  发表于 2022-6-10 01:34:29
例如,对谷歌搜索数据的调查已应用于预测汇率波动(Smith,2012)、私人消费(Vosen和Schmidt,2011)和交易行为(Preis等人,2013)。此外,Ettredge等人(2005年)是首批使用谷歌搜索数据预测宏观经济指标(包括失业率)的研究人员之一。对于美国,Choi和Varian(2009)以及D\'Amuri和Marcucci(2017)发现,最近下岗的人很可能在网上搜索失业福利、空缺或福利相关话题,因此,可以使用谷歌数据改进失业预测。Askitas和Zimmermann(2009)、Smith(2016)和McLaren(2011)发现德国和英国的结果相似。正如许多研究人员所建议的那样,更好的宏观经济预测可以用来为经济决策提供信息,并弥补传统数据来源的滞后性。超越以往的研究,本文试图通过测试基于美国每月失业率预测的假设投资策略,探讨将基于谷歌的宏观经济预测纳入投资决策过程的建议益处。由于就业增长是经济的重要刺激因素,因此也是金融市场投资决策的驱动因素,我希望能够利用基于谷歌的预测策略构建一个有利可图的交易策略。本研究旨在通过揭示宏观经济新闻对股价的影响,为文献做出贡献。对于寻求了解在线数据对市场时机的有用性的投资者来说,这可能很有趣。方法和结果在本研究中,我首先分析了预测美国每月失业率的可能性() 使用每月一次的谷歌搜索查询量,搜索34个搜索词和搜索类别。

板凳
能者818 在职认证  发表于 2022-6-10 01:34:32
从圣路易斯联邦储备银行网站上获取了2004年1月至2017年12月期间美国平民失业率的月度和季节性调整数据。在同一时期,使用谷歌趋势服务IU。S、 劳工统计局,《平民失业率》,摘自圣路易斯联邦储备银行FRED;https://fred.stlouisfed.org/series/UNRATE,2018年3月5日。3获得的每月谷歌网络搜索量仅限于美国用户的搜索请求。我使用了两步方法来识别相关的谷歌搜索词,以便进行分析。首先,通过考虑过去的研究,我确定了一个由8个搜索词组成的基本集(D\'Amuri和Marcucci,2017年,第9页,Smith,2016年,第265页)。其次,利用根词“jobs”、“Undercase”和“Undercase”的手套词嵌入,我通过计算190万个英语单词与这些根词之间的欧氏距离,识别出另外22个语义相关的单词。我认为基于单词-单词共现的单词嵌入特别有助于识别搜索词,这些搜索词通常与根词一起搜索,或者更一般地,与失业相关。此外,继Choi和Varian(2009,第1页)之后,我在分析中加入了四个谷歌搜索类别,即“工作”(60)、“福利与失业”(706)、“工作与劳工问题”(703)和“工作列表”(960)。没有使用特定的数据转换,但需要注意的是,谷歌数据在特定时间段内的最大搜索量标准化为0到100之间的范围,受到某些限制,需要谨慎对待。

报纸
可人4 在职认证  发表于 2022-6-10 01:34:35
谷歌趋势数据是使用抽样方法提供的,导致其每天都在变化(Choi和Varian,2012,第1页),因此,数据中可能存在未观察到的异质性。正如之前的研究所建议的那样,我将使用美国每月失业率水平和谷歌搜索数据(D\'Amuri和Marcucci,2017年,第12-13页)展示我的所有预测结果。与以往的研究类似 预测模型基于线性回归公式(方程式2),其中包括滞后自回归分量和一个外生变量滞后(), 在这项研究中,哪些是特定搜索词或类别的谷歌搜索量 (迈凯轮,2011年,第136页)。与之前的研究一样,为了观察Google Trends数据是否提高了预测精度,将所有模型与基线模型进行比较(Eq。

地板
nandehutu2022 在职认证  发表于 2022-6-10 01:34:38
1) ,这是一个简单的AR(1)自回归模型,包括前一个月的失业水平作为解释变量(McLaren,2011,p.136,Choi和Varian,2009,p.2)。从Google Trends检索的34个搜索词和类别的每月Google搜索量,https://trends.google.com/trends/,2018年3月5日。通用爬网(42B标记)手套单词嵌入,检索自斯坦福大学,https://nlp.stanford.edu/projects/glove/,2018年3月4日。手套词嵌入是通过无监督学习算法获得的词的向量表示,该算法根据来自web数据文本语料库的聚合全局词-词共现统计数据进行训练(Pennington et al.,2014)。使用自然语言处理,Google Trends将搜索查询分为大约30大类和250个子类(Choi和Varian,2012)。基线模型:   (1) 备选型号:    (2) 需要注意的是,与之前的研究不同,我没有包括同期的搜索量 在等式2中,由于我后来提出的投资策略所施加的限制。因此,从技术上讲,这不是一个“即时预测”问题,就像文献中广泛研究的那样(Choi和Varian,2009,第2页,Smith,2016,第267页,D\'Amuri和Marcucci,2017,第14页,McLaren,2011,第136页)。然而,正如美国劳工统计局(BLS)所述,失业率() “在t月,是指在一周内(包括t月12日)没有工作但可以工作的个人,以及在参考周结束的前4周内寻找工作的个人”(D\'Amuri和Marcucci,2017年,第9页)。因此,我决定在Eq中加入谷歌搜索量的一个滞后。

7
大多数88 在职认证  发表于 2022-6-10 01:34:42
2能够捕捉到寻找工作的个人的研究成果,他们最终被纳入失业率计算。使用2004年1月至2017年12月的全部数据对这两个模型进行样本估计。样本外测试使用滚动窗口程序进行,其中模型使用过去36个月进行估计,以预测 在随后的一个月。通过比较每个备选模型与基线模型的均方误差(MSE)和平方残差,评估模型的预测性能及其统计显著性(图1)。根据Wilcoxon配对符号秩检验平方模型残差,五个拟议的替代模型实现了统计上显著的样本外预测改进,最大的改进是包括谷歌搜索量在内的搜索词下岗量(                           ).5图1 |使用谷歌搜索数据预测美国每月失业率的改善。(A) 样本内和(B)样本外预测误差,由34个月美国失业率的均方误差(MSE)衡量()  包含谷歌趋势数据的回归模型。所有34个模型都包含一个自回归滞后(), 每月谷歌搜索量滞后一次() 作为解释变量. 使用2004年1月至2017年12月的全部数据对回归进行了样本估计。样本外测试使用滚动窗口程序进行,其中模型使用过去36个月进行估计,以预测 在随后的一个月。

8
大多数88 在职认证  发表于 2022-6-10 01:34:46
所有模型均以具有一个滞后(垂直蓝线)的基线自回归预测模型为基准。我发现谷歌搜索数据在样本内和样本外都改善了相对于基线模型的MSE,在五个谷歌趋势模型的样本外有显著的统计改善(                           Wilcoxon平方模型残差配对符号秩检验)。在谷歌趋势系列中,样本外MSE与基线模型相比分别下降了25.0%和8.3%,搜索词为下岗和失业 ;  ;  ). 此外,所有参数估计值都具有统计显著性,尽管有关系数估计值的统计结论需要谨慎对待,因为分布假设并不成立,我将在下文讨论。我的结果与过去的研究基本一致,例如,D\'Amuri和Marcucci(2017,第16页)发现,在没有谷歌数据的情况下,AR(1)比AR(1)提高了23%(  ) 与使用谷歌的最佳模式相比(  ). 此外,请注意,虽然一些谷歌趋势模型,如谷歌搜索类别“福利和失业”,增加了样本外MSE(图1A),但所有这些模型至少表现出相同的性能,并且大多在样本内MSE(图1B)中有所改善,突出了样本外测试程序的重要性。总的来说,我可以支持这样一种观点,即谷歌对大多数拟议搜索词的查询量都包含可预测的信息,这些信息可能与失业统计数据中包含的个人的就业研究工作有关,如前所述。

9
nandehutu2022 在职认证  发表于 2022-6-10 01:34:49
由于我的回归分析侧重于失业率和谷歌搜索时间序列数据,因此关于参数估计重要性的结论取决于平稳性和正态性假设。然而,在分别用增广Dickey-Fuller和Shapiro-Wilk检验对其进行检验后,我发现,只有少数例外情况下,单位根的无效假设不能被拒绝,正态性被强烈拒绝。由于标准普尔500指数的回报率也是非正态分布的(Christoffersen,2011,第9页),我将在以下分析中仅报告无分布测试。我研究的第二部分涉及基于之前介绍的假设性投资策略的实施 预测模型(公式2)。因此,我检索了每日收盘价 2004年1月2日至2017年12月29日期间,对标准普尔500指数进行了股息和拆分调整。基于, 累计回报率 当时   按每日收益的累积乘积计算。此外,为了使交易策略具有可操作性,我计算了历史发布日期 当月就业情况报告的. 我提出了一个投资策略,其中投资决策为 在ZF数据发布前15个交易日( ) 根据预测的 . 如果预计失业率会下降( ), 标准普尔500指数以收盘价买入. 但是,如果, , 我买如果 , 否则卖空。这一二阶标准基于心理学和行为金融学的研究结果,即人们倾向于对正面新闻过重,而对负面新闻反应不足(Easterwood和Nutt,1999,p.1777)。

10
mingdashike22 在职认证  发表于 2022-6-10 01:34:52
因此,尽管失业率持续上升,但如果失业率没有像前一时期那样强劲上升,这很可能被视为利好消息,并被解释为危机放缓,因此我购买。这种逻辑在经济不稳定的情况下是颠倒的,因此,降低失业率通常是好消息这一基本理念没有改变。在我的设置中,如果  且交易头寸保持到下一个投资决策日。根据可用的谷歌数据、滞后一个月的模型制定和36个月的模型估计期,2007年4月6日星期五发布的2007年3月ZF数据的第一个交易决定是在2007年3月15日做出的,因此,投资期从2007年3月16日开始。这是从雅虎检索到的标准普尔500指数的重要调整日收盘价!资金https://finance.yahoo.com/quote/%5EGSPC/history/2018年3月5日UNEM发布日期的计算基于以下事实:数据“通常在参考周结束后的第三个星期五发布,即包括本月12日在内的一周”(另见:https://www.bls.gov/ces/ces_tabl.htm)7注意,在我的分析中,我忽略了交易费用,因为使用我的策略时,每年的最大交易数量只有24笔。然而,在实际实现中,此类交易费用肯定会影响利润。图2 |美国失业可预测性与交易利润之间的相关性。美国月度失业率样本外均方误差(MSE)之间的相关性() 预测和累计交易回报。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-16 14:48