楼主: kedemingshi
1159 15

[量化金融] 用谷歌趋势预测金融市场,而不是那么随机 [推广有奖]

11
大多数88 在职认证  发表于 2022-4-28 17:55:31
数据窥探相当于没有样本外的情况,即使在正确地进行了样本内和样本外滑动测试时也是如此。让我们执行一些示例参数调整。一旦选择了金融资产,提议的策略只有一个参数,即执行移动平均值的时间步数。图1报告了与关键字债务相关的绩效t-tstat作为k的函数。它的符号对于k范围内的变化相对稳健∈ 2,··,30,但其在该区间的典型值并不特别特殊(介于1和2之间)。现在让我们来看看四组中绝对最好的关键词:月球巡逻队。它的t-stat的价值观和稳定性都比债务要好得多(见图2),但这很可能是由于纯粹的偶然性。因此,没有理由相信一个关键字多于另一个关键字。H.无交易费每笔交易平均成本为2个基点(0.02%),每年交易104次,交易时间为8年(2004-2011),交易费会使任何关键字的绩效降低约20%。作为一种有益的副作用,当考虑交易成本时,流动费用减去绩效的周期突然变成负绩效周期,这提供了更现实的预期。与价差和价格影响相关的成本也应包括在适当的包装测试中。0 20 40 60 80 100-0.5 0.0 0 0.5 1.0 1.5 2.0 2.5ktstat2004 2006 2008 20120.5 1.0 1.5 2.0 2.5 3.0 3.5计算的性能BTK=3k=5k=10k=20k=30k=50k=100图1:左图:t-stat作为移动平均k长度的函数。右图:k的各种值的累积性能。交易成本设置为每笔交易2bps。0 50 100 150 200-10123吨-statdebtMoon Patrol图2:与关键词debt和Moon Patrol相关的性能统计数据与移动平均值的长度K。

12
大多数88 在职认证  发表于 2022-4-28 17:55:34
交易成本设置为每笔交易2个基点。四、 GOOGLE Trends的预测能力鉴于上面列出的许多方法学缺陷,人们可能会对[24]的结论产生怀疑。我们在这里证明他们是正确的。第一步是避免上述方法学问题。我们中的一个人使用了工业级的回溯测试系统和更复杂的策略(因此会导致工具偏差)。首先,让我们比较一下我们定义的三个随机关键词集以及英国《金融时报》的一组关键词的累积表现。对于每一组关键字,我们选择原始SVI、滞后SVI和SVI的各种移动平均值,以及过去的指数回报作为输入。事实证明,没有一个关键词集能带来能够预测显著指数变动的信息(见图4)。这与[9,11,24]的结果并不矛盾。这仅仅意味着信号可能太弱,无法在实践中加以利用。业绩的最后一部分当然很吸引人,但这是因为在这段时间内,周一至周五收盘的间谍回报基本上都是正面的:任何仅应用于回报的机器学习算法都可能产生相同的结果。到目前为止,我们只能得出结论,一个给定的适当(而不是过于严格)的回溯测试系统无法确定2004年2006年2008年2010年21.0 1.5 2.0 2.5在没有tcwith tcFigure 3:k=3的关键字债务相关的累积绩效,有无交易成本,设置为2bps。2006年2008年2010年20120.90 0.95 1.00 1.05累积绩效。Times2008 2009 2010 2011 2012 20131.0 1.1 1.2 1.3计算性能图4:左图:与2005-12-23至2013-06-14四个关键字集中的每一个相关的累积性能。Rightplot:适用于适当资产的适当关键字的累积性能。

13
mingdashike22 在职认证  发表于 2022-4-28 17:55:37
交易成本设定为每笔交易2个基点。四个关键字集中的任何可利用信息,而不是关键字集不包含足够的可预测信息。总之,我们使用相同的回溯测试系统,使用一些GT数据,参数和输入类型与之前完全相同。由此产生的初步性能(如图4所示)更有希望,并表明GT数据中确实存在一些一致的预测信息。与SPY本身的性能相比,它并不是特别令人印象深刻,但仍然很有趣,因为净曝光率总是接近于零(有关更多信息,请参见[6])。V.讨论需要复杂的方法加上仔细的回溯测试来表明Google Trends包含足够的可利用信息。这是因为这些数据包含了太多可能与给定关键字的金融资产无关的搜索,甚至更与实际交易无关。当一个人通过提供更多关键字来限制搜索时,GT数据通常只包含每月时间尺度的信息,或者根本不包含任何信息。如果回到[24]提出的算法和[9,11]的兼容结果,很难理解为什么未来价格会在SVI惊喜后系统性地恢复,一周后反之亦然。反向性很弱,只在平均水平上有效。这可能是最常见的结果,但如果知道是什么触发反转或趋势跟踪,则可获得更高的支持率。有证据表明,用新闻补充GT数据可以极大地改善交易表现(见[4])。同一组织的另一篇论文提出了一个更有希望的信息来源:它将给定公司在维基百科页面上的访问次数变化与未来的指数回报联系起来[22]。

14
能者818 在职认证  发表于 2022-4-28 17:55:41
进一步的工作将调查这类数据的预测能力。我们承认与弗里德里克·阿伯格尔、马鲁安·阿纳内和蒂埃里·博丘德进行了激动人心的讨论。[1] 当请求限制在给定季度的数据时,GT返回每日数据。[2] 法布里斯·贝拉德。Qemu,一款快速便携的动态翻译器。USENIX,2005年。网址:www.qemu。组织。[3] 史蒂芬·J·布朗、威廉·戈茨曼、罗杰·G·伊博森和史蒂芬·A·罗斯。绩效研究中的生存偏差。《金融研究回顾》,5(4):553-5801992。[4] 罗切斯特·卡汉。Quant 3.0——利用网络情绪,2012年。统一资源定位地址http://qwafafew.org/images/uploads/DBQQWAFAFEW201212.pdf.[在线;于2013年7月16日访问]。[5] 詹妮弗·卡斯尔、尼古拉斯·福塞特和大卫·F·亨德利。即时预报不仅仅是同期预测。国家研究所经济评论,210(1):71-892009。[6] D.夏莱。2013年恩克莱德资本内部报告。最终版本将于9月按要求提供。[7] 崔贤英和哈尔·瓦里安。用谷歌趋势预测当下。《经济记录》,88(s1):2012年2月至9日。[8] 志达、约瑟夫·恩格尔伯格和高鹏杰。寻找收益的可预测性。技术报告,工作文件,2010年。[9] 志达、约瑟夫·恩格尔伯格和高鹏杰。寻求关注。《金融杂志》,66(5):1461-14992011。[10] Michel M.Dacorogna、Ramazan Gencay、Ulrich A.Müller、Richard B.Olsen和Olivier V.Pictet。高频金融导论。学术出版社,伦敦,2001年。[11] 米哈尔·泽林斯基。衡量经济不确定性及其对股市的影响。《金融研究快报》,9(3):167-1752012。[12] 埃德温·J·埃尔顿、马丁·杰伊·格鲁伯和克里斯托弗·布莱克。幸存者偏见和共同基金业绩。《金融研究回顾》,9(4):1097–1120,1996年。[13] 乔恩·浮士德、约翰·H·罗杰斯和乔纳森·H·赖特。七国集团GDP公告中的新闻和噪音。

15
能者818 在职认证  发表于 2022-4-28 17:55:44
《货币、信贷和银行杂志》,第403-419页,2005年。[14] 约翰·D·弗里曼。在烟雾和镜子背后:评估投资模拟的完整性。《金融分析师期刊》,第26-31页,1992年。[15] Jeremy Ginsberg、Matthew H Mohebbi、Rajan S Patel、Lynnette Brammer、Mark S Smolinski和Larry Brilliant。使用搜索引擎查询数据检测流感疫情。《自然》杂志,457(7232):1012-10142008。[16] 斯蒂芬·哈迪曼、尼古拉斯·贝科特和让·菲利普·布乔德。金融市场的临界反应:霍克斯过程分析。arXiv预印本arXiv:1302.14052013。[17] N·F·约翰逊。私人通讯。[18] Jonathan G Koomey、Stephen Berard、Marla Sanchez和Henry Wong。计算机电效率历史趋势的影响。《计算历史年鉴》,IEEE,33(3):46–542011。[19] 马克·H·克莱德和张秀金。硬盘驱动器之后——接下来是什么?磁学,IEEE学报,2009年第45(10)期:3406–3413页。[20] 大卫·J·莱因韦伯。愚蠢的数据挖掘技巧:超越标准普尔500指数。《投资杂志》,16(1):15-22,2007年。[21]M.Marsili。剖析金融市场:行业和州。定量。鳍2, 2002.[22]海伦·苏珊娜·莫特、切斯特·克鲁姆、亚当·阿瓦基安、德罗·凯内特、尤金·斯坦利和托比亚斯·普赖斯。在股市波动之前量化维基百科的使用模式。科学报告,2013年3月。[23]Gordon E Moore等人。将更多组件塞进集成电路。电子学,(39):1965年1月至4日。[24]托拜厄斯·普赖斯、海伦·苏珊娜·莫特和尤金·斯坦利。使用谷歌趋势量化金融市场的交易行为。科学报告,2013年3月。[25]瑞安·沙利文、艾伦·蒂默尔曼和哈尔伯特·怀特。数据监听、技术交易规则性能和引导。《金融杂志》,54(5):1647-16911999。[26]哈尔伯特·怀特。对数据窥探的现实检查。

16
可人4 在职认证  发表于 2022-4-28 17:55:47
《计量经济学》,68(5):1097-112620000。[27]维基百科。谷歌趋势——维基百科,免费百科全书,2013年。统一资源定位地址http://en.wikipedia.org/wiki/Google_Trends.[在线;于2013年6月4日访问]。[28]当请求仅限于给定季度的数据时,GT返回每日数据。附录A:关键字我们已经下载了以下关键字的GT数据,没有任何手动编辑。1.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 14:31