楼主: nandehutu2022
454 17

[量化金融] 谷歌搜索能否帮助即时预测和预测美国的失业率 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-5-6 19:00:59 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Can Google searches help nowcast and forecast unemployment rates in the
  Visegrad Group countries?》
---
作者:
Jaroslav Pavlicek and Ladislav Kristoufek
---
最新提交年份:
2014
---
英文摘要:
  Online activity of the Internet users has been repeatedly shown to provide a rich information set for various research fields. We focus on the job-related searches on Google and their possible usefulness in the region of the Visegrad Group -- the Czech Republic, Hungary, Poland and Slovakia. Even for rather small economies, the online searches of their inhabitants can be successfully utilized for macroeconomic predictions. Specifically, we study the unemployment rates and their interconnection to the job-related searches. We show that the Google searches strongly enhance both nowcasting and forecasting models of the unemployment rates.
---
中文摘要:
互联网用户的在线活动已被反复证明为各个研究领域提供了丰富的信息集。我们关注谷歌上与工作相关的搜索,以及它们在维谢格拉德集团所在地区——捷克共和国、匈牙利、波兰和斯洛伐克——可能的有用性。即使是规模较小的经济体,其居民的在线搜索也可以成功地用于宏观经济预测。具体而言,我们研究了失业率及其与工作相关搜索的关联。我们发现,谷歌搜索大大增强了失业率的即时预测和预测模型。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--

---
PDF下载:
--> Can_Google_searches_help_nowcast_and_forecast_unemployment_rates_in_the_Visegrad.pdf (151.85 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:谷歌搜索 失业率 unemployment Successfully Mathematical

沙发
mingdashike22 在职认证  发表于 2022-5-6 19:01:04
谷歌搜索能否帮助维谢格拉德集团国家预测失业率?Jaroslav Pavlicekand Ladislav Kristoufek1,2,3,*捷克共和国科学院信息理论与自动化研究所,Pod Vodarenskou vezi 4,布拉格8,182 08,捷克共和国,欧盟2经济研究所,查尔斯大学,Opletalova 26,110 00,捷克共和国布拉格,欧盟3华威商学院,华威大学,考文垂,西米德兰,CV4 7AL,英国,欧盟* 电子邮件:kristouf@utia.cas.czAbstractOnline互联网用户的活动已被反复证明为各种研究领域提供了丰富的信息集。我们关注谷歌上与工作相关的搜索,以及它们在维谢格拉德集团所在地区——捷克共和国、匈牙利、波兰和斯洛伐克——可能的有用性。即使对于规模较小的经济体,居民的在线搜索也可以成功地用于宏观经济预测。具体来说,我们要研究失业率及其与工作相关搜索的相互关系。我们发现,谷歌搜索大大增强了失业率的即时预测和预测模型。网络活动已经成为现代社会固有的一部分,成为人们的生活方式。互联网为用户提供大量信息,并在需要时提供帮助和帮助。在当前的金融危机以及随之而来的经济和生产危机中,大多数发达经济体和发展中经济体都受到了经济衰退的打击,而经济衰退通常与就业增长紧密相关。失业可能是一种非常痛苦的经历,会对一个人的生活产生长期的影响。于是,寻找一份新工作就成了日常生活中不可或缺的一部分。

藤椅
kedemingshi 在职认证  发表于 2022-5-6 19:01:07
在当前的数字化时代,求职并不局限于工作,而是求职者(以及潜在雇主)更频繁地将互联网作为信息来源和新的可能性。因此,求职者会留下他们实践的数字轨迹。在过去的几年里,对网络活动的各种模式的分析和检查已经成为一个富有成效的研究分支,有一些令人兴奋的应用,如选举[1]、投资分配[2,3]、私人消费[4]和消费者行为[5]、未来导向[6]、收入公告[7]、疾病传播[8-12]以及经济和金融[13-19]。回到失业问题及其可能利用互联网用户的在线活动进行的检查,该地区已经进行了一些研究,主要集中在谷歌引擎搜索查询上。第一项研究关注谷歌搜索活动与德国失业率之间的可能联系,研究表明,将搜索查询数据添加到模型中非常有用[20]。以下研究[21–23]分析了美国失业福利查询和申请与失业率本身之间的关系[24,25]。甚至基于谷歌搜索数据的求职活动指数也已经开发出来了【26】。这些研究大多集中在美国经济及其建模上,而对其他经济体的研究相对较少[27,28]。在这里,我们关注的是谷歌搜索引擎上与工作相关的搜索查询与所谓的维谢格拉德集团国家(塞奇共和国、匈牙利、波兰和斯洛伐克)的失业率之间可能存在的联系。我们的贡献如下。首先,我们关注的是一组通常被视为边缘国家的国家,因此没有太多研究。

板凳
mingdashike22 在职认证  发表于 2022-5-6 19:01:10
然而,如果要宣称在线搜索活动(尤其是谷歌搜索)的效用,其效率不仅应该在发达国家和覆盖范围很广的国家表现出来,还应该在较小的国家表现出来,其结果可能对所有决策者有用,即使是在这些地区。其次,我们为失业建模提供了一个谨慎而循序渐进的过程,不仅关注简单的相关性,还关注即时预测、预测和因果关系。第三,进行了跨国比较,这在主要针对一个特定国家的可比研究中是相当独特的。结果在被分析的国家中,失业率经历了相当异质的演变(图1)。在捷克共和国,2004年至2013年间,该比率在4%至9%之间。最初,从2004年到2008年,该比率从9%下降到4%,出现了显著的下降趋势。随着2008年经济衰退对捷克共和国的打击,2010年,该比率开始上升,达到8.5%的新最高水平。从那时起,失业率在7%到8.5%之间波动。从2004年到2010年,匈牙利的失业率稳步上升,达到了近12%的新最高水平。此后,该比率在10.5%和12%之间波动了近3年,并在2013年开始下降。波兰的失业率从2004年近22%的天文数字下降到2009年的6%。然而,随着经济衰退打击波兰,失业率再次上升。经过一些小的波动,它平稳地上升到目前约10%的水平。在洛瓦基亚,失业率似乎与捷克共和国的失业率有着相似的模式,尽管规模不同。2004年,斯洛伐克的失业率高达20%。这一比率在2009年直线下降至8%。

报纸
大多数88 在职认证  发表于 2022-5-6 19:01:13
随着经济衰退的打击,失业率迅速上升到16%,一直持续到今天。谷歌搜索的发展如图2所示。这四个系列都有明显的季节性模式。匈牙利的特点是,在谷歌搜索中,tr end的数量定期增加,而斯洛伐克的情况正好相反,剩下的两个分析序列在时间上保持相当稳定。尽管谷歌搜索与捷克共和国和匈牙利的失业率之间似乎存在某种联系,但如果没有适当的分析,我们很难断言两者之间存在任何关系。基本关系作为第一步,我们给出平稳性测试的结果,它告诉我们应该分析原始序列还是它们的一些t变换。在标签上。1.我们展示了原始序列和对数序列的ADF和KPSS测试结果(更多细节请参见方法部分)及其第一个差异。结果相当正确,因为我们不拒绝单位根f或原始序列(或其对数变换。对于谷歌搜索,我们不检查失业时间序列的对数变换,因为它们已经在百分比表示中)。本文未报告的进一步测试表明,失业率和搜索查询序列之间没有协整关系,因此我们需要处理序列的第一个差异。对于大多数情况,我们支持第一个差异的平稳性。在分析中,我们进一步分析了失业率的第一个差异和谷歌搜索的第一个对数差异。

地板
mingdashike22 在职认证  发表于 2022-5-6 19:01:16
我们选择这种组合,因为百分比代表和对数变换的对可以直接解释为弹性,即成比例关系。对于失业率和谷歌上与工作相关的搜索强度之间最基本的关系,我们研究以下等式URt=α+α log(GI)t+εt(1),其中乌尔坦德 log(GI)t代表时间t的失业率的第一个差异,以及谷歌搜索时间t的第一个对数差异,分别代表agiven country,ε是一个错误术语。根据公式1,谷歌搜索和失业率之间的弹性估计为0.5538(p=0.0533)、0.2056(0.0726)、0.3317(0.2163)和0。捷克共和国、匈牙利、波兰和斯洛伐克分别为4630(0.0062),具有异方差和自相关一致性(HAC)标准误差。因此,在分析过的国家中,比例关系各不相同,但在所有四个国家中,比例关系都是正的,在四分之三的国家中,比例关系在统计学上是显著的(至少10%的显著水平)。具体而言,捷克共和国和斯洛伐克的关系非常密切,其价值约为0.5。这表明,失业率的变化很好地反映在sea rch对空缺和工作相关条款的在线查询中。因此,研究这两个变量之间的关系似乎值得进一步利用和研究。现在,宏观经济时间序列(如失业率)有一个特殊的特性,这在金融序列或自然科学中的其他序列中是不存在的——它们具有明显的滞后性。这是由于数据处理和收集通常需要几个月的时间,即使在这段时间之后,有时也会对报告的值进行修正。

7
kedemingshi 在职认证  发表于 2022-5-6 19:01:19
这种特性使一个序列在没有任何滞后的情况下立即可用,并且与感兴趣的变量有很强的相关性,它在预测变量的现值时非常有用,无需等待几个月。这种对现在的预测通常被称为“正在预测”。在上一节中,我们已经表明,谷歌搜索与工作相关的术语与失业率显著相关,这使得搜索查询可能对失业率的即时预测有用。作为一个即时预测模型,我们考虑以下一个URt=β+Xi=3βi城市轨道交通-i+Xj=0γj 对数(GI)t-j+εt(2),其中假设失业率有三个月的滞后。我们将考虑由于上述平稳性问题而产生的差异序列。两个系列都保持了12个月的滞后,这控制了两个系列中的季节模式。现播模型的结果总结在表1中。2.在这里,我们展示了调整后的R(`R),作为模型对解释变量数量的质量控制的度量。我们观察到,对于所有国家来说,谷歌系列的加入都有力地增强了这一模式。对于所有国家来说,这一数字增加了约三分之一,但波兰的增幅略小。尽管如此,搜索查询的加入极大地改善了所有国家的模型,F统计报告了搜索的重要性。即使在1%的水平上,所有系列都具有共同意义。预测和因果关系即时播报的结果非常有希望,它们说明了谷歌搜索系列的有用性。然而,我们也感兴趣的是,这种有用性是否主要是由于失业数据的不可用,还是sea-rch-ies数据也提供了额外的信息价值。

8
何人来此 在职认证  发表于 2022-5-6 19:01:23
为了做到这一点,我们还进行了一次标准的预测练习,我们实际上假设如果直接获得失业数据,会发生什么。如果谷歌系列改进了这种假设模型,我们可以得出结论,搜索查询数据除了自身与失业率的变化密切相关外,还为模型带来了额外的信息。对于预测练习,我们使用标准向量自回归模型(VAR,参见方法部分f或更多详细信息)。具体模型采用以下形式:URt=β+Xi=1β1i城市轨道交通-i+Xi=1γ1i 对数(GI)t-i+ε1t 对数(GI)t=β+Xi=1β2i城市轨道交通-i+Xi=1γ2i 对数(GI)t-i+ε2t(3),并与一个简单的失业自回归模型进行了比较URt=δ+Xi=1δ1i城市轨道交通-i+νt.(4)为了进行比较,我们使用了预测质量的两种度量——均方根误差和平均绝对误差(分别为RMSE和MAE,有关更多详细信息,请参见方法部分)。这些措施非常简单——它们越低,模型的性能越好。此外,我们还利用Diebold-Marianotest[29]将两个模型的预测性能与执行相同操作的模型的零假设进行了比较(更多详细信息,请参见方法部分)。该模型是根据2004年1月至2012年12月之间的系列进行估算的,预测期设定在2013年1月至12月之间。预测性能总结见表1。3.在这里,我们可以看到,对于所有国家,随着谷歌搜索的增加,模型的预测性能都有了显著提高。Diebold-Mariano测试的结果进一步证明了这一点,该测试给出了显著的结果,即对于所有国家,使用谷歌数据的模型的性能都超过了不使用谷歌数据的模型,至少达到了5%的显著水平。

9
mingdashike22 在职认证  发表于 2022-5-6 19:01:26
因此,在线搜索数据显然为失业建模提供了额外的信息价值。作为分析的最后一步,我们提供了因果关系检查。因此,我们相信这两个分析系列之间的特殊关系。具体来说,我们要检查失业率的上升是否会导致人们更多地查找与工作相关的术语,或者网络活动的增加是否表明就业市场上存在潜在的紧张关系,或者两者兼而有之,或者根本没有。为此,我们利用了基于VAR分析的Granger因果关系框架(详见方法部分)。结果汇总在表中。3.请注意,格兰杰因果关系的无效假设是“诺格兰杰因果关系”。因此,如果无效假设被拒绝,因果关系就会被发现。这些发现相当同质。对于四分之三的计数序列(亨加里除外),我们报告了两个方向的因果关系。因此,影响来自两个方向,而这一系列的影响彼此强烈。互联网用户的在线讨论活动在各个领域都被证明是有用的。现在,失业率就是其中之一。与关注发达(西方)国家的文献流行趋势相反,我们将重点放在了Visegrad集团的工作相关谷歌搜索上,即捷克共和国、匈牙利、波兰和斯洛伐克。尽管互联网的数据可用性和利用率在该地区可能不像发达国家预期的那样普遍,但我们已经证明,事实上,在线搜索为失业建模提供了非常坚实的基础。总之,我们已经表明,谷歌搜索工作相关术语的基本动态与失业率密切相关。

10
能者818 在职认证  发表于 2022-5-6 19:01:30
此外,我们利用这个想法,利用谷歌搜索的当前和滞后值,成功地预测了失业率。研究表明,这些结果不仅是因为失业率无法立即获得,还因为在线搜索的额外信息价值。我们的发现表明,互联网用户留在网上的信息可以很容易地被利用,即使是像维谢格拉德集团这样的小国。方法从欧盟统计局数据库中获取捷克共和国、匈牙利、波兰和斯洛伐克的月度失业数据。欧盟国家失业测量的基础是欧盟劳动力调查(EU LFS)——一项持续且协调的家庭调查,该调查符合每个成员国执行的欧盟立法。欧盟统计局的月度数据是基于欧盟LFS结果的估计。由于欧盟国家没有每月提供数据的法律义务,因此这些数据经常使用国家调查或登记的失业数据进行插值/外推。根据欧盟统计局(Eurostat),失业人员被定义为15至74岁的人,在参考周内没有工作,可以在两周内开始工作,并且在过去四周的某个时间积极寻求工作。在我们的分析中,我们使用了一般(性别,15-74岁)未经季节性调整的失业率。我们这样做是因为我们不知道季节性调整所使用的方法,谷歌数据也没有季节性调整。谷歌搜索查询数据已从谷歌趋势网页下载。由于所研究国家的语言不同,我们对各种术语都有所了解。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:55