楼主: 可人4
1925 63

[量化金融] 复杂数据集中因果关系的度量及其在金融领域的应用 [推广有奖]

31
nandehutu2022 在职认证  发表于 2022-5-5 08:46:58
导致伦敦银行同业拆借利率的利率在大多数情况下p值仍然为零,但另一个方向的p值在一开始的几个连续窗口中都低于0.1水平,模型的解释力在最大0.07水平上得到了提高;我们的解释是因果关系是非线性的。图6。Kernelised Geweke的因果关系度量。左图显示了当考虑具有一个滞后的模型时,通货膨胀在统计上导致伦敦银行同业拆借利率(蓝线)或反过来导致伦敦银行同业拆借利率(红线)的假设的p值集。右图显示了P值和因果关系度量值的散点图。00.10.20.30.40.50.60.70.80.91p-数值01/31/8602/29/8803/31/9004/30/920 0.05 0.1 0.15 0.200.10.20.30.40.50.60.70.80.91因果关系度量图7。线性Geweke因果关系度量。(左)美国消费者价格指数方向统计因果关系假设的p值集→ 一个月的伦敦银行同业拆借利率(蓝线)或另一个月的伦敦银行同业拆借利率(红线),当考虑具有线性核和滞后1的模型时。(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-值01/31/8602/29/8803/31/9004/30/920 0.02 0.04 0.0600.10.20.30.40.50.60.70.80.91因果关系度量图8。Kernelised Geweke的因果关系度量。(左)美国CPI方向统计因果关系假设的p值集→ 当考虑具有高斯核和滞后2的模型时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-值01/31/8602/29/8803/31/9004/30/920 0.02 0.04 0.06 0.0800.10.20.30.40.50.60.70.80.91因果关系度量图9。线性Geweke因果关系度量。(左)美国方向统计因果关系假设的p值集。

32
能者818 在职认证  发表于 2022-5-5 08:47:01
居民消费价格指数→ 当考虑具有线性核和滞后7的模型时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-数值01/31/8602/29/8803/31/9004/30/920 0.02 0.04 0.06 0.0800.10.20.30.40.50.60.70.80.91因果关系测量图8中给出的第二个滞后的结果不再像图6中的滞后1(两种情况下均为高斯核)那样清晰。导致通货膨胀的利率假说在大多数情况下仍有接近于零的p值,但另一个方向的p值也很小。这一次,因果关系的值较低,达到略低于0.08。使用线性核,我们得到了不太清晰的结果,我们的解释是因果方向CPI→ 伦敦银行同业拆借利率更强,但也可能有一些反馈。图9显示了使用线性核的结果,它显示了两个方向更好的分离,适用于滞后7的模型。对于滞后8和9的模型,可以看到非常相似的结果。对于这些大滞后,没有明显的原因说明线性核比高斯核表现得更好。我们提供的解释是,没有任何非线性因果关系是足够强和一致的,而这一点通过使用非线性核得到了进一步的掩盖。本文的结论是,模型选择是检测因果关系的一个重要方面,需要进一步研究。在我们的分析中,我们没有获得转移熵或HSNCIC的显著结果。图10和图11分别显示了转移熵和HSNCIC的滞后1结果。对于滞后1,在美国CPI的方向上存在显著的统计因果关系→ bothGeweke的措施支持的一个月伦敦银行同业拆借利率。这在转移熵和HSNCIC中几乎看不到。

33
何人来此 在职认证  发表于 2022-5-5 08:47:04
转移熵的p值仅与随机效应略有偏离,而对于HSNCIC,它们通常是显著的;然而,这两个方向并没有很好地分开。更高滞后的结果往往更难解释。我们必须强调,HSNCIC传输熵和参数选择的不同实现可能会带来更好的性能(请参阅第5.1节和第5.2节)。图10。转移熵。(左)美国CPI方向统计因果关系假设的p值集→ 考虑滞后1时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-值01/31/8602/29/8803/31/9004/30/920 0.1 0.2 0.3 0.400.10.20.30.40.50.60.70.80.91因果关系度量图11。HSNCIC。(左)美国CPI方向统计因果关系假设的p值集→ 考虑滞后1时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-价值01/31/8602/29/8803/31/9004/30/920 0 0.5 1 1.5 200.10.20.30.40.50.60.70.80.91因果关系的衡量4。1.2. 权益对套利交易货币对我们分析了六种汇率(澳元兑日元、加元兑日元、新西兰元兑日元、澳元兑瑞士法郎、加元兑瑞士法郎、新西兰元兑瑞士法郎和标准普尔指数),并调查了任何“领头羊-跟随者”类型的模式。我们的期望是标准普尔应该领先。我们使用了汤森路透2008年7月18日至2013年10月18日期间的每日数据。我们研究了货币与标准普尔之间的成对依赖关系,并分析了添加芝加哥期权交易所市场波动率指数(VIX)辅助信息的结果。

34
nandehutu2022 在职认证  发表于 2022-5-5 08:47:07
在所有情况下,我们都使用对数返回。图12显示了应用高斯核的kernelised Geweke测度的结果。每25天移动一个窗口的250个点的数据系列。与之前的利率和通货膨胀情况不同,线性和高斯核方法之间几乎没有实际差异。然而,在少数情况下,使用阿加西核可以更好地分离两个方向,尤其是CADCHF→ 标准普尔和标准普尔→ CADCHF给定VIX。除CADCHF外,在分析对标准普尔的因果影响时,所有货币对都表现出类似的行为。这种行为由少数窗口组成,对于这些窗口,当P值低于0.1时,因果关系显著,但不会持续。CADCHF是唯一一种对标准普尔有持续显著因果影响的货币,2008年和2009年开始出现这种情况。至于另一个方向,对于AUDCHF、CADCHF和NZDCHF,有一些时期标准普尔对它们的影响是显著的,以P值衡量。图12。

35
kedemingshi 在职认证  发表于 2022-5-5 08:47:10
假设汇率导致股票指数的p值集合,标准普尔(蓝色)或反之(红色)。澳元兑日元为00.51蓝色-> 标准普尔和红色代表标准普尔->AUDJPYp-价值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51 CADJPY蓝色-> 标准普尔和红色代表标准普尔->卡德皮普-NZDJPY的数值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51蓝色-> 标准普尔和红色代表标准普尔->NZDJPYp-价值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51澳元蓝色-> 标准普尔和红色代表标准普尔->CHFP AUDP-CADCHF的值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.20.40.60.81蓝色-> 标准普尔和红色代表标准普尔->CADCHFp-NZDCHF的数值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.20.40.60.81蓝色-> 标准普尔和红色代表标准普尔->NZDCHFp-价值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/11我们获得了所有主要的“制度”:汇率或标准普尔中任何一个具有更大解释力的时期(一个方向的P值比另一个方向低得多),以及两者都表现出低或高P值的时期。接近1的p值并不一定意味着纯粹缺乏因果关系:在这种情况下,在特定滞后时间内,测试因果关系的时间序列的随机排列似乎比该滞后时间序列本身具有更高的解释力。关于数据、测量和排列测试本身的性质,几乎没有可能的解释。我们在模拟数据上观察到,当不存在因果关系时,自相关会给排列测试带来偏差:p值高于我们对随机样本的预期,但也有更高的可能性将相关性解释为因果关系。

36
nandehutu2022 在职认证  发表于 2022-5-5 08:47:14
此外,假设一个模型的滞后时间与数据的滞后时间不同,这两种偏差都可能导致。相应地,如果数据是用瞬时耦合模拟的,并且没有因果关系,这也会导致高p值。在所有四种方法中,转移熵似乎最容易产生这些偏差。图13显示了与图12类似的信息,但将VIX作为次要信息考虑在内。其基本原理是,标准普尔对套利交易货币的因果效应可能与感知的市场风险水平有关。然而,图表并没有显示包含VIX后因果效应的消失。虽然这些模式没有发生显著变化,但我们观察到,汇率已经失去了对标准普尔的大部分解释力,其中对CADCHF的解释力最大。另一个方向的p值几乎没有差异;因此,这两个方向之间的区别变得更加重要。图13。

37
kedemingshi 在职认证  发表于 2022-5-5 08:47:18
假设汇率导致股票指数S&p,假设波动率指数(VIX)作为辅助信息(蓝色)或反过来(红色),p值集。00.51kGC,假设VIX,澳元兑日元为蓝色-> 标准普尔和红色代表标准普尔->AUDJPY07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,CADJPY为蓝色-> 标准普尔和红色代表标准普尔->CADJPY07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.20.40.60.81kGC,给定Vix,NZDJPY为蓝色-> 标准普尔和红色代表标准普尔->NZDJPY07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,蓝色代表澳元CHF-> 标准普尔和红色代表标准普尔->AUDCHF07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,蓝色代表CADCHF-> 标准普尔和红色代表标准普尔->CADCHF07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,NZDCHF为蓝色-> 标准普尔和红色代表标准普尔->NZDCHF07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/115。讨论和展望虽然科学界通常会问一些关于因果关系的问题,但在不同的情况下,量化因果关系的适当方法还没有得到很好的发展。首先,通常情况下,答案是用不专门用于此目的的方法制定的。有一些科学领域,例如营养流行病学,通常通过相关性推断因果关系[48]。经济学中一个被称为“米尔顿·弗里德曼恒温器”的经典例子,描述了在评估联邦储备的背景下,如何将缺乏相关性与缺乏因果关系混为一谈[49]。其次,问题通常是按照(对称的)依赖性来表述的,因为它涉及到既定的方法,并允许明确的解释。

38
可人4 在职认证  发表于 2022-5-5 08:47:22
这可能是manyrisk管理应用中的一种情况,在这种应用中,什么导致损失的问题应该是核心问题,但通常不会用因果方法解决[50]。目前正在开发的量化因果关系的工具有助于更好地量化因果推理,更好地理解结果。在本节中,我们对这些方法进行了评论,以帮助理解它们的缺点,并使读者能够为预期用途选择最合适的方法。这也将为未来的研究指明可能的方向。本节第一部分描述了两种方法之间的主要差异,然后对模型选择和与置换测试相关的问题进行了一些评论。本节总结了对未来研究方向的建议。5.1. 理论差异线性与非线性:最初的Granger因果关系及其Geweke度量公式是用来评估线性因果关系的,它们非常稳健且有效。对于具有线性相关性的数据,使用线性格兰杰因果关系很可能是最佳选择。当相关性不是线性的,但具有强线性分量时,测量也可以很好地工作。由于金融数据通常不会表现出平稳性、线性或高斯性,因此不应使用线性方法对其进行分析。在实践中,对数据集大小和模型选择差异的要求优先,这意味着仍应考虑线性方法。直接和间接因果关系。格兰杰因果关系是不可传递的,这可能是不直观的。尽管及时性会使因果关系度量更接近于对该术语的共同理解,但它也可能导致无法区分直接原因和间接原因。

39
kedemingshi 在职认证  发表于 2022-5-5 08:47:25
因此,它可能会使度量对于降维和重复信息的目的无效。然而,直接因果关系和间接因果关系之间的区别并不一定很明确。这是因为添加条件变量既可以引入变量,也可以消除变量之间的依赖关系[51]。因此,直接和间接因果关系的概念与整个信息系统有关,如果我们向系统中添加新的变量,它可能会发生变化。使用图形建模的方法[1]有助于定义直接因果关系和间接因果关系的概念,因为这两个术语在因果网络中定义得很好。在某些情况下,Geweke和kernelised Geweke的措施可以区分直接和间接原因。以Ambrard[9]为例,我们建议比较条件因果测量和非条件因果测量,以此区分线性因果关系和核格兰杰因果关系的直接和间接因果关系。像HSNCIC这样的措施,明确地建立在这样一种方式上,即它们以次要信息为条件,因此,只针对直接原因;然而,这并没有达到预期效果,因为我们注意到HSNCIC对数据的维度非常敏感。传递熵(我们使用的形式)根本不考虑边信息。提出了一种称为部分转移熵[52,53]的新方法来区分直接原因和间接原因。虚假因果关系:在前一点关于直接和间接原因的部分内容中,虚假因果关系的问题是一个更广泛的问题。如前所述,因果关系是根据给定的数据推断出来的,引入更多的数据可以增加和消除(虚假的)因果关系。另一个问题是,数据可能表现出多种类型的依赖性。

40
kedemingshi 在职认证  发表于 2022-5-5 08:47:28
我们在本文中讨论的方法都不能同时管理几种类型的依赖,无论是瞬时耦合、线性还是非线性实用性。我们请感兴趣的读者参考在频域或使用滤波器对格兰杰因果关系和转移熵建模的文献[31,54,55]。数值估计:已经提到,Granger因果关系和核Granger因果关系对小样本和高维具有鲁棒性。这两种方法都优化了二次成本,这意味着它们对异常值很敏感,但基于核的Geweke方法可以通过参数选择来实现这一点。二元数据的Granger因果关系具有良好的统计显著性检验,而其他数据则没有,并且需要计算昂贵的置换检验。此外,在岭回归的情况下,还有另一层优化参数,这在计算上也是非常昂贵的。计算核函数在计算上也相对昂贵(除非数据是高维的),但它们对小样本很稳健。HSNCIC有一个很好的估计量,在有限数据的限制下,它不依赖于核的类型。另一方面,转移熵面临着与估计分布相关的问题:小样本量和高维度的问题。选择正确的估计器有助于减少问题。[35]中详细概述了估算熵的可能方法。Trentool是计算转移熵的较流行的开放获取工具箱之一,它使用最近邻技术来估计联合概率和边际概率,这是Kraskov等人首次提出的[27,39,56]。最近邻技术是一种数据高效、自适应且偏差最小的技术[35]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 06:22