楼主: mingdashike22
316 16

[量化金融] 谷歌趋势数据是否比价格回报更具可预测性? [推广有奖]

11
可人4 在职认证  发表于 2022-5-7 19:56:59
它的标志是相对稳健的,不受基于谷歌趋势数据70 50 100 150 200的投机策略的2次回溯测试范围内的变化的影响-10123吨-statdebtMoon巡逻图。1:T-与关键字debt和MoonPatrol相关的性能统计数据与移动平均k的长度。交易成本设置为每笔交易2bps。K∈ 2,···,30,但其在该区间的典型值并不特别例外。现在让我们来看看四组中绝对最好的关键词:月球巡逻队。其t-stat的值和稳定性范围都比DEBT好得多(见图1),但这完全是由于纯粹的偶然性。避免参数过度匹配的一个解决方案是在合理的参数范围内平均策略的性能。让我们为上面介绍的每个列表的每个关键字取k=1,···,100。由于所有关键字都作用于单个资产,因此我们对每个列表使用一个同等权重的方案,从而计算所有关键字和所有K的平均位置。由此产生的累计绩效净额(交易成本设定为每笔交易2个基点,减去考虑期间计算的绩效15%)如图2所示。对于随机关键词来说,这是相当随机的,但对于Preis等人[2013]的有偏关键词来说,这是略微积极的,这与他们报告的t-stats的总体积极偏差是一致的。然而,它并不是很有吸引力,年化零利率夏普比率约为0.12,t-stat为0.37,这远不是很重要。此外,从2011年起,其性能将发生变化,即样品外。2.8比较价格回报和GT数据作为预测,我们遵循好主意,选择公司股票代码和名称作为关键词(参见Da等人[2011],Kristoufek[2013]),但也添加了我们自己发明的其他简单、不过度匹配的关键词。

12
nandehutu2022 在职认证  发表于 2022-5-7 19:57:02
每周GT数据一直在下调2基于谷歌趋势数据82004 2006 2008 2010 20120.95 1.00 1.05 1.10累积绩效等的推测性策略。2004 2006 2008 2010 20120.80 0.85 0.90 0.95 1.00 1.05累积绩效CARS2004 2006 2010 20120.80 0.85 0.90 0.95 1.00累积绩效2004 2008 2010 20120.85 0.90 0.95 1.05累积绩效表现良好。2:与四组关键字相关的累积性能。每次交易费用为2个基点。1.0 1.5 2.0性能-1.0 0.0 1.0净敞口0 1 2 3 4交叉敞口2006 2008 2010 40 80#股票数据+价格回报1。0 1.5 2.0性能-1.0 0.0 1.0净敞口0 1 2 3 4交叉敞口2006 2008 2010 40 80#股票收益1。0 1.5 2.0性能-1.0 0.0 1.0净敞口0 1 2 3 4交叉敞口2006 2008 2010 40 80#股票数据图。3:GT和收益(左)、仅GT(中)和仅价格收益(右)组合中的累积业绩、净风险敞口和总风险敞口,以及股票数量。每笔交易的成本为2个基点。3讨论9周回报率[bps]周波动率[bps]年化IR t-statGT+回报率17.1 134 0.92 2.73回报率16.9 133 0.92 2.72GT 18.3 134 0.99 2.93Tab。2:三种类型预测器的回溯测试性能汇总统计。。每笔交易的成本为2个基点。加载于2013年4月21日。首先,我们不试图预测纯每周回报,而是预测投资期。向我们的回溯测试系统提供GT数据,可以得到图3最左边的图:这些数据中有一些可利用的信息。校准窗口长度约为6个月,出现在2008年和2009年,当时系统首先学会只做空,然后恢复到多头。这需要花费大量时间,并显示出在用每周信号校准交易策略时所面临的困难。

13
大多数88 在职认证  发表于 2022-5-7 19:57:06
汇总统计数据见表2。重要的是要意识到,这些回溯测试在很大程度上受工具偏差的影响,因为它们使用了大量的计算方法和功能强大的计算机,而这些计算机在回溯测试的大部分时间都不可用。现在让我们比较一下仅基于GT数据或仅基于过去回报的预测器的性能(图3)。我们发现基本相同的性能(见表2);威尔科克斯秩和检验p值为0.72:两者差异不大。这可能是因为回溯测试系统只是学会了无条件地识别趋势,换句话说,预测值同样无用。因此,我们从预测中删除了一些信息内容。例如,通过计算每个预测因子的滚动中值;预测器的值现在被减少到一个二进制数,该二进制数编码它属于前一个中值的哪一侧。然后,我们使用与之前完全相同的回溯测试系统和相同的参数。与GT数据和价格回报相关的性能现在是明确的(图4)。这里使用的机器学习方法可以利用GT输入(至少是我们能想到的)比基于价格回报的输入更少的可预测性;然而,其他机器学习方法产生了相反的结果。最后,图5报告了应用于weeklyreturns的相同方法的结果,这表明即使没有交易成本,在这种情况下预测可能有多困难。3讨论我们无法证明谷歌趋势数据包含比价格回报本身更多的可利用信息。假设这不是因为我们没有使用正确的方法,我们的发现表明谷歌趋势数据等同于价格回报本身。

14
nandehutu2022 在职认证  发表于 2022-5-7 19:57:09
它们确实分享了许多具有价格回报的财产:它们是许多个人创造的聚合信号,它们反映了与基础资产相关的东西。此外,两者都非常嘈杂:关于GT数据的不确定性,从他们之前的讨论102006 2008 2010 2012 20141.0 1.2 1.4 1.6 1.8 2.0计算的性能EGT+回报TRETURNSFIG中收集。4:累积性能GT和返回,仅GT,使用二进制输入时仅返回。参数与图3相同。交易成本设定为2bps。0.4 1.0 1.6性能-1.0 0.0 1.0净敞口0 1 2 3 4交叉敞口2006 2008 2010 20 20 60#股票回报和GT数据图。5:累计业绩、净风险敞口和总风险敞口,以及GT和回报组合中的股票数量。仓位可能会在每周一的市场收盘时改变。没有交易成本。3.讨论形式,约为5%。从这个角度来看,GT数据并没有什么神奇的突破。我们必须使用复杂的非线性方法,再加上仔细的回溯测试程序,这与当前学术文献中通常看到的简单得多的方法形成了对比。之所以需要它,可能是因为很难猜测SVI的增加意味着什么,因为它可能与好消息(例如潜在客户的更高兴趣)或坏消息(例如担心公司本身)有关,或者两者都有,或者两者都没有。事实上,这些数据包含了太多与给定关键字的金融资产无关的搜索,甚至还有更多与实际交易无关的搜索。因此,根据与给定资产相关的新闻数量的变化添加另一个信号有助于解释SVI的变化意味着什么[Wang,2012,Cahan,2012]。

15
nandehutu2022 在职认证  发表于 2022-5-7 19:57:11
另一种可能性是使用其他数据源,如Twitter或维基百科[Moatet al.,2013],它们具有以更高频率提供数据的宝贵优势。无论如何,我们向社区提出挑战,要求他们证明,对于agiven回溯测试系统,基于每周谷歌趋势数据的预测值只能优于基于价格的预测值,而价格本身每周产生约17个基点(包括2个基点的交易成本)。我们感谢与弗里德·埃里克·阿伯格尔、马鲁安纳内(Ecole Centrale)和蒂埃里·博丘德(Encelade Capital)进行的富有启发性的讨论。参考资料:维尔纳·安特维勒和默里·Z·弗兰克。那些话只是噪音吗?网络股票留言板的信息内容。《金融杂志》,59(3):1259-12942004。约翰·博伦、毛惠娜和曾晓军。推特情绪预测股市。计算科学杂志,2(1):2011年1-8月。Ilaria Bordino、Stefano Battiston、Guido Caldarelli、Matthieu Cristelli、AnttiUkkonen和Ingmar Weber。网络搜索查询可以预测股市交易量。PloS one,7(7):2012年4月14日。罗切斯特·卡汉。Quant 3.0——利用网络情绪,2012年。统一资源定位地址http://qwafafew.org/images/uploads/DBQQWAFAFEW201212.pdf.[在线;于2013年7月16日访问]。詹妮弗·卡斯尔、尼古拉斯·福塞特和大卫·F·亨德利。即时预报不仅仅是同期预报。国家研究所经济评论,210(1):71-892009。崔贤英和哈尔·瓦里安。用谷歌趋势预测当下。《经济记录》,88(s1):2012年2月至9日。Cuantopian。通用域名格式。谷歌搜索词预测2014年的市场走势。统一资源定位地址https://www.quantopian.com/posts/3讨论12谷歌搜索词预测市场动向。[在线;访问日期:2014年3月5日]。志达、约瑟夫·恩格尔伯格和高鹏杰。寻求关注。《金融杂志》,66(5):1461-14992011。约翰·D·弗里曼。

16
mingdashike22 在职认证  发表于 2022-5-7 19:57:14
《烟雾和镜子背后:衡量投资模拟的完整性》。《金融分析师杂志》,第26-31页,1992年。Aaron Gerow和Mark T Keane。在网上挖掘herdto的声音,追踪股市泡沫。《第二十二届国际艺术情报联席会议记录》第三卷,2244-2249页。AAAI出版社,2011年。迈克尔·吉本斯和帕特里克·赫斯。每周的影响和资产回报。《商业杂志》,54(4):579,1981年。Eric Gilbert和Karrie Karahalios。普遍的担忧和股市。ICWSM,第59-65页,2010年。Jeremy Ginsberg、Matthew H Mohebbi、Rajan S Patel、Lynnette Brammer、Mark S Smolinski和Larry Brilliant。使用搜索引擎查询数据检测流感疫情。《自然》杂志,457(7232):1012-10142008。迪特玛·珍妮茨科。使用twitter模拟欧元/美元汇率。arXiv预印本arXiv:1402.16242014。N.F.约翰逊,2005年。私人通讯。拉迪斯拉夫·克里斯托菲克。谷歌趋势搜索查询是否有助于风险分散?科学报告,2013年3月。大卫·J·莱因韦伯。愚蠢的数据挖掘技巧:超越标准普尔500指数。《投资杂志》,16(1):15-22,2007年。毛慧娜、斯科特·科恩斯和约翰·博伦。预测金融市场:比较调查、新闻、twitter和搜索引擎数据。arXiv预印本XIV:1112.105112011。海伦·苏珊娜·莫特、切斯特·克鲁姆、亚当·阿瓦基安、德罗·凯内特、尤金·斯坦利和托比亚斯·普雷伊斯。在股市波动之前量化维基百科的使用模式。科学报告,2013年3月。托比亚斯·普里斯、海伦·苏珊娜·莫特和尤金·斯坦利。使用谷歌趋势量化金融市场的交易行为。科学报告,2013年3月。Michael Rechenthin、W Nick Street和Padmini Srinivasan。股票聊天:利用股票情绪预测价格方向。算法金融,2(3):169–196,2013年。瑞安·沙利文、艾伦·蒂默尔曼和哈尔伯特·怀特。

17
nandehutu2022 在职认证  发表于 2022-5-7 19:57:17
数据窥探、技术交易规则性能和引导。《金融杂志》,54(5):1647-16911999。武田富美子和和花拓美。谷歌搜索强度及其与日本股票收益率和交易量的关系。2013年,王彦博。媒体和谷歌:信息供求对股票回报的影响。可从SSRN 21804092012获得。哈伯特·怀特。对数据窥探的现实检查。《计量经济学》,68(5):1097-112620000。维基百科。谷歌趋势——维基百科,免费百科全书,2013年。统一资源定位地址http://en.wikipedia.org/wiki/Google_Trends.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 07:51