楼主: 可人4
842 63

[量化金融] 复杂数据集中因果关系的度量及其在金融领域的应用 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

77%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
45.4007
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24788 点
帖子
4166
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Measures of Causality in Complex Datasets with application to financial
  data》
---
作者:
Anna Zaremba and Tomaso Aste
---
最新提交年份:
2014
---
英文摘要:
  This article investigates the causality structure of financial time series. We concentrate on three main approaches to measuring causality: linear Granger causality, kernel generalisations of Granger causality (based on ridge regression and the Hilbert--Schmidt norm of the cross-covariance operator) and transfer entropy, examining each method and comparing their theoretical properties, with special attention given to the ability to capture nonlinear causality. We also present the theoretical benefits of applying non-symmetrical measures rather than symmetrical measures of dependence. We apply the measures to a range of simulated and real data. The simulated data sets were generated with linear and several types of nonlinear dependence, using bivariate, as well as multivariate settings. An application to real-world financial data highlights the practical difficulties, as well as the potential of the methods. We use two real data sets: (1) U.S. inflation and one-month Libor; (2) S$\\&$P data and exchange rates for the following currencies: AUDJPY, CADJPY, NZDJPY, AUDCHF, CADCHF, NZDCHF. Overall, we reach the conclusion that no single method can be recognised as the best in all circumstances, and each of the methods has its domain of best applicability. We also highlight areas for improvement and future research.
---
中文摘要:
本文研究了金融时间序列的因果结构。我们专注于测量因果关系的三种主要方法:线性Granger因果关系、Granger因果关系的核推广(基于岭回归和互协方差算子的Hilbert-Schmidt范数)和转移熵,检查每种方法并比较其理论性质,特别注意捕捉非线性因果关系的能力。我们还介绍了应用非对称度量而非对称依赖度量的理论好处。我们将这些度量应用于一系列模拟和真实数据。模拟数据集是使用双变量和多变量设置,以线性和几种类型的非线性依赖生成的。对真实世界金融数据的应用突出了这些方法的实际困难和潜力。我们使用两个真实数据集:(1)美国通货膨胀和一个月伦敦银行同业拆借利率;(2) 以下货币的S$\\&$P数据和汇率:澳元兑日元、加元兑日元、新西兰元兑日元、澳元兑瑞士法郎、加元兑瑞士法郎、新西兰元兑瑞士法郎。总的来说,我们得出的结论是,在所有情况下,没有一种方法可以被认为是最好的,并且每种方法都有其最佳适用范围。我们还强调了有待改进和未来研究的领域。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--

---
PDF下载:
--> Measures_of_Causality_in_Complex_Datasets_with_application_to_financial_data.pdf (509.05 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:复杂数据 因果关系 金融领域 数据集 Multivariate

沙发
能者818 在职认证  发表于 2022-5-5 08:45:19 |只看作者 |坛友微信交流群
Article复杂数据集中因果关系的度量,以及金融数据的应用Anna Zaremb1,*和Tomaso Aste1,2伦敦大学学院计算机科学系,伦敦高尔街,伦敦WC1E 6BT,英国系统风险中心,伦敦经济和政治科学学院,伦敦WC2AE,英国*通信作者;电子邮件:A。Zaremba@cs.ucl.ac.uk;电话:+44-0-20-3108-1305;传真:+44-0-20-7387-1397。熵16(2014)2309-2349。内政部:10.3390/e16042309。摘要:本文研究了金融时间序列的因果结构。我们专注于测量因果关系的三种主要方法:线性Granger因果关系、Granger因果关系的核推广(基于岭回归和互协方差算子的Hilbert–Schmidt范数)和转移熵,检查每种方法并比较其理论性质,特别注意捕捉非线性因果关系的能力。我们还介绍了应用非对称度量而非对称依赖度量的理论益处。我们将这些测量应用于一系列模拟和真实数据。模拟数据集是使用双变量和多变量设置,以线性和几种类型的非线性相关性生成的。对真实金融数据的应用突出了实际困难以及这些方法的潜力。我们使用两个真实数据集:(1)美国通货膨胀和一个月伦敦银行同业拆借利率;(2) 以下货币的标准普尔数据和汇率:澳元兑日元、加元兑日元、新西兰元兑日元、澳元兑瑞士法郎、加元兑瑞士法郎、新西兰元兑瑞士法郎。总的来说,我们得出的结论是,在所有情况下,没有一种方法可以被认为是最好的,并且每种方法都有其最佳适用范围。

使用道具

藤椅
nandehutu2022 在职认证  发表于 2022-5-5 08:45:22 |只看作者 |坛友微信交流群
我们还强调了有待改进和未来研究的领域。关键词:因果关系;格兰杰因果关系;Geweke的因果关系度量,转移熵;岭回归;互协方差运算符1。导言了解时间序列之间的相关性对于几乎所有复杂系统的研究都至关重要,能够在金融数据中描述因果关系结构对金融机构非常有益。本文集中讨论了四种可以被称为“统计因果关系”的衡量标准。Pearl[1]提出的“基于干预的因果关系”与Granger[2]提出的“统计因果关系”之间存在重要区别。第一个概念结合了统计数据和非统计数据,允许回答问题,比如“如果我们给患者用药,即干预,他们的生存机会会增加吗?”。统计因果关系不能回答这样的问题,因为它不涉及干预的概念,只涉及数据分析工具。因此,统计意义上的因果关系是一种依赖关系,我们根据对时间结构的了解以及因果关系必须先于因果关系的概念来推断方向。它对金融数据很有用,因为它通常被建模为一个随机过程的单一实现:在这种情况下,我们不能像Pearl那样谈论干预。如果Y的未来可以更好地用Y和X的过去而不是仅仅用Y的过去来解释,我们说X在统计(格兰杰)因果关系的意义上导致Y。我们将使用不同的模型扩展并进一步形式化这个概念。引用Pearl的话,“在每一个因果性声明背后,必然存在一些因果性假设,这些假设在联合分布中是不可识别的,因此在观察研究中是不可检验的”([1],第40页)。

使用道具

板凳
何人来此 在职认证  发表于 2022-5-5 08:45:25 |只看作者 |坛友微信交流群
Pearl强调需要明确区分统计术语和因果术语,虽然我们不遵循他的术语,但我们同意,重要的是要记住,统计因果关系无法发现“真正的原因”。统计因果关系可以被认为是一种依赖关系,用于描述统计因果关系的一些方法源自用于测试独立性的方法。选择最有用的描述因果关系的方法必须基于数据的特征,我们对数据了解得越多,就可以做出更好的选择。就金融数据而言,最大的问题是缺乏平稳性和噪音。如果我们还认为这种依赖性可能表现出非线性,那么模型选择就成为一个需要更好理解的重要因素。本文的目的是对现有的几种因果关系量化方法进行广泛分析。本文的组织结构如下:在第2节中,我们提供了有关这些方法的所有背景信息,以及文献综述。在第3节中,我们描述了实践方面、实现细节、测试方法以及对合成数据的测试结果;第4节介绍了财务和其他应用。在第5节中,我们将介绍这些方法、应用和前景。第6节包含一个简短的总结。最后,在附录A-E中,我们提供了数学背景和其他补充材料。2.研究方法:文献综述。1.

使用道具

报纸
可人4 在职认证  发表于 2022-5-5 08:45:28 |只看作者 |坛友微信交流群
因果关系的定义,方法维纳[3]在1956年的一篇论文中首次提到因果关系是一种可以估计的属性:“对于两个同时测量的信号,如果我们使用第二个信号的过去信息比使用没有它的信息更好地预测第一个信号,那么我们称第二个信号为第一个信号的因果关系。”2003年诺贝尔经济学奖得主克莱夫·格兰杰(Clive Granger)在1963年[4]和1969年[5]引入了这一概念的首次实际实施。格兰杰将因果关系定义为随机过程的线性自回归模型。格兰杰描述了一个原因应该具有的主要属性:它应该发生在效应之前,并且应该包含关于效应的独特信息,而这些信息不包含在其他变量中。格兰杰在他的著作中深入讨论了因果关系的含义,以及他引入的统计概念与确定性因果关系的区别。2.1.1. Granger因果关系在最普遍的意义上,如果在考虑第一个信号时可以更好地预测第二个信号,我们可以说第一个信号导致第二个信号。如果引入时间概念,且第一个信号先于第二个信号,则为格兰杰因果关系。在这两个信号同时出现的情况下,我们将使用瞬时耦合这一术语。Geweke在1982年[6]和1984年[7]发表的两项研究扩展了Granger的原始想法,包括反馈和瞬时因果关系(瞬时耦合)的想法。Gewekee定义了衡量因果关系和瞬时耦合的指标,包括有无副信息。虽然Geweke引入的指数只是用于量化格兰杰因果关系的少数几种替代方法之一,但这些论文及其引入的措施对于我们处理因果关系至关重要。

使用道具

地板
大多数88 在职认证  发表于 2022-5-5 08:45:32 |只看作者 |坛友微信交流群
Geweke定义了线性反馈的度量,代替Granger使用的因果关系强度,这是文献中流行的替代Granger因果关系度量之一[8]。我们使用源自[9]的符号和定义,并对其进行概括。设{Xt},{Yt},{Zt}为三个随机过程。对于任何时间序列,使用下标t,如在Xt中,它将被理解为与时间t相关联的随机变量,而使用上标t,如在Xt中,它将被理解为直到时间t的随机变量的集合。因此,我们使用Xt和XTA来实现这些随机变量。定义1(格兰杰因果关系)Y不会格兰杰导致X,相对于所有t的边信息Z和IFF∈ Z:PXt | Xt-1,Yt-k、 Zt-1.= PXt | Xt-Zt,1-1., (1) 其中k是任意自然数,P(···)代表条件概率分布。如果k=0,我们认为Y不会瞬间导致X(瞬时耦合):PXt | Xt-1,Yt,Zt-1.= PXt | Xt-1,Zt-1.. (2) 在双变量情况下,边信息Zt-1,将被省略。所提出的瞬时耦合定义方法是可行的,但它只是几种替代定义中的一种,没有一种是先验最优的。安布拉德[10]建议包括Zt而不是Zt-1确保测量避免混淆[11]X和Y与X和Z的瞬时耦合。定义1非常笼统,没有规定分配的平等性应如何评估。最初的格兰杰因果关系公式是根据最小平方预测值的残差方差[5]。有很多方法可以测试这一点;在这里,我们将在很大程度上遵循[9]中的方法。让我们从介绍(格兰杰)因果关系的度量开始,该度量最初由格韦克在[6,7]中提出。

使用道具

7
能者818 在职认证  发表于 2022-5-5 08:45:35 |只看作者 |坛友微信交流群
设{Xt},{Yt}为两个单变量随机过程,{Zt}为多变量过程(该设置可推广为包括多变量{Xt},{Yt})。我们假设向量自回归表示;因此,我们假设{Xt}可以用以下一般方式建模:Xt=LX(Xt-1) +LY X(Yt)-1) +LZX(Zt)-1) +εX,t(3),其中LX,lyx,lzx是线性函数。在等式(3)中,我们允许一些函数Lo,处处等于零。例如,如果我们在模型(3)中使用{Xt}而没有任何限制,并且使用相同的模型,但添加了LY X=0:Xt=~LX(Xt)的限制-1) +LZX(Zt)-1) +εX,t(4),然后我们可以用Geweke因果度量公式量化包含{Yt}在解释{Xt}时的有用性,公式如下:→XkZ=logvar(Xt | Xt-Zt,1-1) var(Xt | Xt-1,Yt-Zt,1-1) =logvar(△εX,t)var(εX,t)。(5) 类似地,Geweke对瞬时因果关系(瞬时耦合)的测量定义为:FY·XkZ=logvar(Xt | Xt-Zt,1-1) var(Xt | Xt-1,Yt,Zt-1) =logvar(△εX,t)var(^εX,t),(6)其中^εX,t与另一个可能的模型相关,其中考虑了Y的过去和现在:Xt=^LX(Xt)-1) ^LY X(Yt)+^LZX(Zt)-1) +εX,t。在下一节中,我们将使用核方法对Geweke的测度进行推广。2.1.2.

使用道具

8
大多数88 在职认证  发表于 2022-5-5 08:45:38 |只看作者 |坛友微信交流群
基于Geweke量化因果关系的线性方法,我们在这里介绍了一种非线性度量,它使用机器学习的“核技巧”来推广线性模型。从机器学习的角度来看,有大量关于因果推理的文献。最初,人们的兴趣集中在独立性测试[12-16];但后来,人们认识到独立性和非因果关系是相关的,测试一个的方法可以用于测试另一个[14,17]。特别是在过去几年中,核化已成为许多领域推广线性算法的流行方法。核方法的主要思想是变量之间的非线性关系可以变成变量函数之间的线性关系。这可以通过将数据嵌入(隐式)希尔伯特空间并在该空间中搜索有意义的线性关系来实现。核方法的主要要求是数据不能单独呈现,而只能以数据点之间的成对比较的方式呈现。作为两个变量的函数,核函数可以解释为一个比较函数。它也可以被认为是内积的推广,这样内积就可以在变量的函数之间取;这些函数称为“特征映射”。2012年,Ambrard等人发表了这篇论文[9],据我们所知,这是第一篇建议使用岭回归推广格兰杰因果关系的论文。

使用道具

9
mingdashike22 在职认证  发表于 2022-5-5 08:45:41 |只看作者 |坛友微信交流群
从某种程度上说,这种晚发展是令人惊讶的,因为岭回归是一种成熟的推广线性回归和引入核的方法;它有一个非常清晰的解释,良好的计算性能和一个简单的优化参数的方法。孙晓海在[18]中提出了另一种对格兰杰因果关系进行核处理的方法。Sun建议在特征空间中使用所谓条件交叉协方差算子(见定义3)的Hilber–Schmidt范数的平方根来测量预测误差,并使用置换测试来量化可预测性的改善。虽然本文描述的两种内核方法都不是基于Sun的文章,但它们密切相关。特别是,希尔伯特-施密特标准化条件独立性准则(HSNCIC)的概念与Sun探索的类似。Marinazzo等人[19]描述了另一种格兰杰因果关系核化方法。下面,我们遵循[20]中的方法。有关函数分析和希尔伯特空间的补充信息,请参见附录B。让我们用S=(x,…,xn)表示一组来自过程{Xt}的n个观测值。我们假设每个观测值xi都是某个集合X的一个元素。为了分析数据,并使用“内核技巧”:我们创建了一个数据集S的表示,它使用成对比较k:X×X→ 集合点的R,而不是单个点。然后,集合S用n×n comparisonski,j=k(xi,xj)表示。定义2(正定义核)函数k:X×X→ R被称为正有限核,仅当它是对称的,即,x、 x∈ X,k(X,X)=k(X,X)和正(半)定义,即:十、xn∈ 十、Ccn∈ RnXi=1nXj=1icjk(xi,xj)>0。

使用道具

10
能者818 在职认证  发表于 2022-5-5 08:45:44 |只看作者 |坛友微信交流群
(7) 从今往后,我们将使用内核的名称,而不是正(半)定义的内核。定理1对于空间X上的任何核k,存在一个Hilbert空间F和一个映射φ:X→ F,使得[20]:k(x,x)=hφ(x),φ(x)i,对于任何x,x∈ X,(8)其中hu,vi,u,v∈ F表示F中的内积。上述定理给出了定义核的另一种方法。它展示了我们如何创建一个内核,前提是我们有一个特性映射。因为最简单的特征映射是一个单位映射,这个定理证明了内积是一个核。内核技巧是一个简单而普遍的原则,它基于这样一个事实:内核可以被认为是一种更简单的产品。内核技巧可以表述如下[20]:“向量数据的任何算法,如果只能用向量之间的点积来表示,则可以在与任何内核相关的特征空间中隐式执行,方法是用内核求值替换每个点积。”在以下两个部分中,我们将说明核技巧在两个应用中的使用:(1)线性回归格兰杰因果关系的非线性情况的扩展;(2)对非线性情况下的协方差和偏相关等概念的重新表述。2.1.3. Geweke因果关系测度的核化在这里,我们将展示再生核Hilbert空间理论如何应用于广义Granger因果关系的线性测度,正如Geweke所提出的。为此,我们将使用岭回归的标准理论。首先,让我们回到之前问题的模型公式(方程式3)。我们假设{Xt}、{Yt}是两个单变量随机过程,{Zt}是一个多元随机过程。现在我们假设有一组观测值S={(x,y,z),…,(xn,yn,zn)},xt,yt∈R、 zt∈ Rk。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 11:19