楼主: mingdashike22
170 16

[量化金融] 谷歌趋势数据是否比价格回报更具可预测性? [推广有奖]

11
何人来此 在职认证  发表于 2022-6-24 17:12:38 |只看作者 |坛友微信交流群
它的标志是相对稳健的,可以抵抗2个范围内的变化,对基于谷歌趋势数据70 50 100 150 200的推测性策略进行回溯测试-1 0 1 2 3吨-statdebtMoon巡逻图。1: 与关键词debt和MoonPatrol相关的性能统计数据与移动平均k的长度。每笔交易的交易成本设置为2bps。k∈ 2,···,30,但其在此区间内的典型值并不特别例外。现在让我们来看看四组中绝对最好的关键词,月球巡逻。其t-stat的值和稳定性范围都比DEBT好得多(见图1),但这完全是由于纯粹的偶然性。避免参数过度拟合的一个解决方案是在合理的参数范围内平均策略的性能。让我们为上面介绍的每个列表的每个关键字取k=1、···、100。由于所有关键字都作用于单个资产,因此我们对每个列表使用一个加权相等的方案,从而计算所有关键字和所有ks的平均位置。图2中报告了设定为每笔交易2bps的累积绩效净额(其减去所考虑期间计算的绩效的15%)。Preis等人[2013]的随机关键词具有一定的随机性,但有偏差的关键词具有轻微的正偏差,这与他们报告的t-stats总体正偏差是一致的。然而,这并不是很有吸引力,年化零利率夏普比率约为0.12,t-stat为0.37,这远远不够。此外,自2011年起,其性能一直保持稳定,即不合格。2.8比较价格回报和GT数据作为预测因素我们遵循好主意,选择公司股票代码和名称作为关键词(参见Da等人[2011],Kristoufek[2013]),但也添加了我们自己发明的其他简单、非过度匹配的关键词。

使用道具

12
nandehutu2022 在职认证  发表于 2022-6-24 17:12:42 |只看作者 |坛友微信交流群
每周GT数据一直在下降2基于谷歌趋势数据82004 2006 2008 2010 2010 2010 2010.95 1.00 1.05 1.10累积绩效Preis et al.2004 2006 2008 2010 2010.80 0.85 0.90 0.95 1.00 1.05累积绩效CARS2004 2006 2010 2010 2010.80 0.85 0.90 0.95 1.00累积绩效2004 2008 2010 2010 2010 2010 2010.85 0.90 0.95 1.05累积绩效性能不足。2: 与四组关键字相关的累积性能。每笔交易费用为2个基点。1.0 1.5 2.0性能-1.0 0.0 1.0净敞口0 1 2 3 4 5交叉敞口2006 2008 2010 40 80#股票数据+价格回报1.0 1.5 2.0性能-1.0 0.0 1.0净敞口0 1 2 3 4 5交叉敞口2006 2008 2010 40 80#股票收益1.0 1.5 2.0绩效-1.0 0.0 1.0净敞口0 1 2 3 4交叉敞口2006 2008 2010 2010 40 80#股票数据图。3: GT和收益(左)、仅GT(中)和仅价格收益(右)组合中的累计业绩、净风险敞口和总风险敞口以及股票数量。每笔交易成本为2bps。3讨论9周回报率[基点]周波动率[基点]年化IR t-statGT+回报17.1 134 0.92 2.73回报16.9 133 0.92 2.72GT 18.3 134 0.99 2.93选项卡。2: 三种类型的预测器的回测性能汇总统计。。每笔交易成本为2bps。2013年4月21日加载。首先,我们不试图预测纯每周回报,而是预测投资期。向我们的回溯测试系统提供GT数据,并返回图3中最左边的图:这些数据中有一些可利用的信息。校准窗口长度约为6个月,出现在2008年和2009年,当时系统首先学会只做空头寸,然后恢复到多头头寸。这需要很多时间,也表明了在用每周信号校准交易策略时所面临的困难。

使用道具

13
何人来此 在职认证  发表于 2022-6-24 17:12:44 |只看作者 |坛友微信交流群
汇总统计数据如表2所示。重要的是要意识到,这些回溯测试在很大程度上受到工具偏差的影响,因为它们使用了大量的计算方法和功能强大的计算机,而这些在回溯测试期间的大部分时间都不可用。现在让我们比较仅基于GT数据或仅基于过去回报的预测值的性能(图3)。我们发现基本相同的性能(见表2);Wilcox秩和检验p值的值为0.72:它们没有太大差异。这可能是因为回溯测试系统只是学会了无条件地识别趋势,换句话说,预测值同样无用。因此,我们从预测中删除了一些信息内容。这可以通过计算每个预测因子的滚动中值来实现;预测器的值现在减少到一个二进制数,该二进制数对它所属的前一个中值的哪一侧进行编码。然后,我们使用与之前完全相同的回溯测试系统和相同的参数。与GT数据和价格回报相关的性能现在已经明确了(图4)。这里使用的机器学习方法可以利用GT输入(至少是我们能想到的)比基于价格回报的输入更少的可预测性;然而,其他机器学习方法产生了相反的结果。最后,图5报告了在weeklyreturns上应用相同方法的结果,这显示了即使没有交易成本,在这种情况下预测可能有多困难。3讨论我们无法证明谷歌趋势数据包含的可利用信息比价格回报本身更多。假设这不是因为我们没有使用正确的方法,我们的发现表明谷歌趋势数据与价格回报本身是等价的。

使用道具

14
可人4 在职认证  发表于 2022-6-24 17:12:47 |只看作者 |坛友微信交流群
它们确实分享了许多具有价格回报的属性:它们是许多个人创造的聚合信号,反映了与基础资产相关的东西。此外,两者都非常吵闹:GT数据的不确定性,收集自他们之前的讨论102006 2008 2010 2012 20141.0 1.2 1.4 1.6 1.8 2.0计算的绩效GT+回报Treturnsfig。4: 累积性能GT和returns、仅GT和仅在使用二进制输入时返回。参数与图3相同。交易成本设定为2bps。0.4 1.0 1.6性能-1.0 0.0 1.0净敞口0 1 2 3 4交叉敞口2006 2008 2010 20 20 60#库存回报和GT数据图。5: GT和回报的累计业绩、净风险敞口和总风险敞口以及投资组合中的股票数量。头寸可能会在每周一的市场收盘时改变。无交易成本。3讨论11格式,约为5%。从这个角度来看,GT数据并没有什么奇迹般的突破。我们必须使用复杂的非线性方法,再加上仔细的回溯测试程序,这与当前学术文献中通常看到的简单得多的方法形成了对比。之所以需要它,可能是因为很难猜测SVI的增加意味着什么,因为它可能与好消息(例如潜在客户的更高兴趣)或坏消息(例如担心公司本身)相关,或者两者都相关,或者两者都不相关。事实上,这些数据包括太多与给定关键字的金融资产无关的搜索,甚至更多与实际交易无关的搜索。因此,根据与给定资产相关的新闻数量的变化添加另一个信号有助于解释SVI的变化意味着什么【Wang,2012,Cahan,2012】。

使用道具

15
可人4 在职认证  发表于 2022-6-24 17:12:50 |只看作者 |坛友微信交流群
另一种可能性是使用其他数据源,如推特或维基百科【Moatet al.,2013】,这些数据源具有频率更高的宝贵优势。无论如何,我们要求社区证明,对于agiven回溯测试系统,基于每周谷歌趋势数据的预测值只能优于基于价格的预测值,而价格本身每周产生约17个基点,包括2个基点的交易成本。我们感谢与Fr'ed'eric Abergel、Marouanneane(中央高等教育学院)和Thierry Bochud(恩克莱德资本)进行的富有启发性的讨论。参考Werner Antweiler和Murray Z Frank。那些话只是噪音吗?网络股票留言板的信息内容。《金融杂志》,59(3):1259–12942004。Johan Bollen、Huina Mao和Xiaojun Zeng。推特情绪预测股市。计算科学杂志,2(1):2011年1-8月。Ilaria Bordino、Stefano Battiston、Guido Caldarelli、Matthieu Cristelli、AnttiUkkonen和Ingmar Weber。网络搜索查询可以预测股市交易量。PloS one,7(7):e40014,2012年。罗切斯特卡汉。Quant 3.0–驾驭网络情绪,2012年。统一资源定位地址http://qwafafew.org/images/uploads/DBQQWAFAFEW201212.pdf.[在线;2013年7月16日访问]。Jennifer L Castle、Nicholas WP Fawcett和David F Hendry。即时预报不仅仅是同期预报。国家研究所经济评论,210(1):71–892009。崔贤英和哈尔·瓦里安。用谷歌趋势预测现在。《经济记录》,88(s1):2012年2-9月。Cuantopian。通用域名格式。2014年,谷歌搜索词预测市场走势。统一资源定位地址https://www.quantopian.com/posts/3讨论12谷歌搜索词预测市场走势。[在线;访问日期:2014年3月5日]。智达、约瑟夫·恩格尔伯格和彭杰高。寻求关注。《金融杂志》,66(5):1461–14992011。约翰·D·弗里曼。

使用道具

16
大多数88 在职认证  发表于 2022-6-24 17:12:54 |只看作者 |坛友微信交流群
《烟雾和镜子背后:衡量投资模拟的完整性》。《金融分析师杂志》,第26-31页,1992年。Aaron Gerow和Mark T Keane。在网络上挖掘Herdt的声音,追踪股市泡沫。《第二十二届国际艺术情报联合会议记录》第三卷,第2244-2249页。AAAI出版社,2011年。迈克尔·吉本斯和帕特里克·赫斯。每周的影响和资产回报。《商业杂志》,54(4):5791981年。埃里克·吉尔伯特和卡丽·卡拉哈利奥斯。普遍的担忧和股市。ICWSM,第59–65页,2010年。Jeremy Ginsberg、Matthew H Mohebbi、Rajan S Patel、Lynnette Brammer、Mark S Smolinski和Larry Brilliant。使用搜索引擎查询数据检测流感疫情。《自然》,457(7232):1012–10142008。Dietmar Janetzko。使用twitter模拟欧元/美元汇率。arXiv预印本arXiv:1402.16242014。N、 F.Johnson,2005年。私人通信。拉迪斯拉夫·克里斯托菲克。谷歌趋势搜索查询是否有助于风险分散?《科学报告》,2013年3月。大卫·J·莱因韦伯。愚蠢的数据挖掘技巧:过度拟合标准普尔500指数。《投资杂志》,16(1):15–22,2007年。毛慧娜、斯科特·库茨和约翰·博伦。预测金融市场:比较调查、新闻、推特和搜索引擎数据。arXiv预印本XIV:1112.10512011。海伦·苏珊娜·莫特、切斯特·克鲁姆、亚当·阿瓦基安、德罗·凯内特、尤金·斯坦利和托拜厄斯·普雷伊斯。在Forestock市场移动之前量化维基百科的使用模式。《科学报告》,2013年3月。托拜厄斯·普里斯、海伦·苏珊娜·莫特和尤金·斯坦利。使用谷歌趋势量化金融市场的交易行为。《科学报告》,2013年3月。Michael Rechenthin、W Nick Street和Padmini Srinivasan。股票喋喋不休:利用股票情绪预测价格方向。算法金融,2(3):169–196,2013年。关键词13Ryan Sullivan、Allan Timmermann和Halbert White。

使用道具

17
何人来此 在职认证  发表于 2022-6-24 17:12:57 |只看作者 |坛友微信交流群
数据窥探、技术交易规则性能和引导。《金融杂志》,54(5):1647-16911999。武田富美子和和花拓美。谷歌搜索强度及其与日本股票收益率和交易量的关系。2013年,王彦博。媒体和谷歌:信息供求对股票回报的影响。SSRN 21804092012提供。Halbert White。数据窥探的真实性检查。《计量经济学》,68(5):1097–11262000。维基百科。谷歌趋势–维基百科,免费百科全书,2013年。统一资源定位地址http://en.wikipedia.org/wiki/Google_Trends.

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-10 09:29