楼主: 可人4
866 63

[量化金融] 复杂数据集中因果关系的度量及其在金融领域的应用 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

77%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
45.5207
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24788 点
帖子
4166
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Measures of Causality in Complex Datasets with application to financial
  data》
---
作者:
Anna Zaremba and Tomaso Aste
---
最新提交年份:
2014
---
英文摘要:
  This article investigates the causality structure of financial time series. We concentrate on three main approaches to measuring causality: linear Granger causality, kernel generalisations of Granger causality (based on ridge regression and the Hilbert--Schmidt norm of the cross-covariance operator) and transfer entropy, examining each method and comparing their theoretical properties, with special attention given to the ability to capture nonlinear causality. We also present the theoretical benefits of applying non-symmetrical measures rather than symmetrical measures of dependence. We apply the measures to a range of simulated and real data. The simulated data sets were generated with linear and several types of nonlinear dependence, using bivariate, as well as multivariate settings. An application to real-world financial data highlights the practical difficulties, as well as the potential of the methods. We use two real data sets: (1) U.S. inflation and one-month Libor; (2) S$\\&$P data and exchange rates for the following currencies: AUDJPY, CADJPY, NZDJPY, AUDCHF, CADCHF, NZDCHF. Overall, we reach the conclusion that no single method can be recognised as the best in all circumstances, and each of the methods has its domain of best applicability. We also highlight areas for improvement and future research.
---
中文摘要:
本文研究了金融时间序列的因果结构。我们专注于测量因果关系的三种主要方法:线性Granger因果关系、Granger因果关系的核推广(基于岭回归和互协方差算子的Hilbert-Schmidt范数)和转移熵,检查每种方法并比较其理论性质,特别注意捕捉非线性因果关系的能力。我们还介绍了应用非对称度量而非对称依赖度量的理论好处。我们将这些度量应用于一系列模拟和真实数据。模拟数据集是使用双变量和多变量设置,以线性和几种类型的非线性依赖生成的。对真实世界金融数据的应用突出了这些方法的实际困难和潜力。我们使用两个真实数据集:(1)美国通货膨胀和一个月伦敦银行同业拆借利率;(2) 以下货币的S$\\&$P数据和汇率:澳元兑日元、加元兑日元、新西兰元兑日元、澳元兑瑞士法郎、加元兑瑞士法郎、新西兰元兑瑞士法郎。总的来说,我们得出的结论是,在所有情况下,没有一种方法可以被认为是最好的,并且每种方法都有其最佳适用范围。我们还强调了有待改进和未来研究的领域。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--

---
PDF下载:
--> Measures_of_Causality_in_Complex_Datasets_with_application_to_financial_data.pdf (509.05 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:复杂数据 因果关系 金融领域 数据集 Multivariate

64
大多数88 在职认证  发表于 2022-5-5 08:48:52 |只看作者 |坛友微信交流群
随机进程的内核独立性测试。2014年,arXiv:1402.4501[stat]。C

使用道具

63
kedemingshi 在职认证  发表于 2022-5-5 08:48:49 |只看作者 |坛友微信交流群
2010年,rXiv:1008.0539.61。我们相信,从i.i.d.数据到阿尔法混合的推广可以与HSIC[75]62类似。杭,H。;斯坦瓦特,I.从加尔帕混合观测中快速学习。J.多瓦尔。肛门。2014,127, 184–199.63. K.Fukumizu.依赖和因果关系的核方法。机器学习暑期学校,德国图宾根,2007年8月20日至31日。肖威·泰勒,J。;模式分析的核心方法;剑桥大学出版社:纽约,纽约,美国,2004.65。汉密尔顿,J.D.时间序列分析;普林斯顿大学出版社:美国新泽西州普林斯顿,1994.66。Hatemi-J,A.应用程序的非对称因果关系测试。帝国。经济部。2012, 43, 447–456.67. 达豪斯,R。;时间序列分析中的因果关系和图形模型。在高结构随机系统中;格林,P.J.,新泽西州霍特,南卡罗来纳州理查森,编辑部。;牛津大学出版社:纽约,纽约,美国,2003.68。波齐,F。;迪马特奥,T。;Aste,T.金融市场的风险扩散:最好投资于周边地区。Sci。2013年第3期,第1665.69页。斯坦瓦特,I。;Christmann,A.支持向量机;斯普林格:纽约,纽约,美国,2008.70。如果每个柯西序列都在这个空间收敛,那么度量空间就是完备的。71.有界线性算子通常不是有界函数。72.如果F是赋范空间,则所有连续线性泛函的空间T:F→ R称为F的原子对偶空间,表示为F.73。我们将要求空间F必须是可分离的(要有一个完整的正交系统),但在实践中,我们将使用Rnand,因此,这不会是一个问题。74.潘,A。;孙,Q。;伯恩斯坦,上午。;舒尔茨医学博士。;曼森,J.E。;斯坦普弗,M.J。;威利特,华盛顿。;Hu,F.B.红肉消费和死亡率:来自2项前瞻性队列研究的结果。拱内科。2012, 172, 555–563.75. Chwialkowski,K。;格雷顿,A。

使用道具

62
nandehutu2022 在职认证  发表于 2022-5-5 08:48:44 |只看作者 |坛友微信交流群
哈佛大学公共卫生学院(Harvard School of Public Health)的科学家2012年发表的一篇关于红肉消费对死亡率影响的论文[74]就是一个在许多国家都有大量媒体报道的例子。弗里德曼,M.美联储的恒温器。网上提供:http://online.wsj.com/news/articles/SB106125694925954100(于2014年4月20日查阅)。N.芬顿。;Neil,M.贝叶斯网络的风险评估和决策分析;华润出版社:美国佛罗里达州博卡拉顿,2012.51。萧,C.经济变量的自回归模型和因果顺序。J.经济。戴恩。控制1982年,4243-259.52。木瓜,A。;凯尔特苏,C。;库吉乌姆齐斯,D。;Diks,C.多元时间序列中直接因果关系测量的模拟研究。熵2013,152635–2661.53。Kugiumtzis,D.秩向量上的部分转移熵。欧元。菲斯。J.特殊上衣。2013,222, 401–420.54. 伦加拉,M。;皮蒂,A。;多尺度的信息传递。菲斯。牧师。E、 非线性软物质物理。2007, 76, 056117.55. 达马拉,M。;兰加拉詹,G。;丁,M.从时间序列数据的傅里叶变换和小波变换估计格兰杰因果关系。菲斯。牧师。莱特。2008, 100, 018701.56. 克拉斯科夫,A。;斯特奥格鲍尔,H。;格拉斯伯格,P.估计相互信息。菲斯。牧师。E、 非线性软物质物理。2004, 69, 066138.57. 第19章经济时间序列模型中的推理和因果关系。在《经济计量学手册》中;Griliches,Z.,Intriligator,医学博士,编辑部。;爱思唯尔:荷兰阿姆斯特丹,1984年;第二卷,第1101-1144.58页。托达,H.Y。;Yamamoto,T.向量自回归中的统计推断与可能的积分过程。J.经济。1995, 66, 225–250.59. 可通过以下网址索取代码:http://www.sussex.ac.uk/Users/anils/aks密码htm。60.戈麦斯·赫雷罗,G。;吴W。;鲁塔宁,K。;索里亚诺,M.C。;琵琶。;从时间序列集合评估耦合动力学。

使用道具

61
mingdashike22 在职认证  发表于 2022-5-5 08:48:41 |只看作者 |坛友微信交流群
评估听觉皮层神经元之间的信息传递。神经生理学。2007, 97, 2533–2543.39. 维森特,R。;威布拉尔,M。;林德纳,M。;Pipa,G.《传递熵——神经科学有效连接性的无模型测量》。J.计算机。神经症。2011, 30, 45–67.40. 布雷斯勒,S.L。;Seth,A.K.维纳-格兰杰因果关系:一种成熟的方法。神经影像2011,58323–329.41。亚历山大,C。;《协整与市场整合:印度尼西亚大米市场的应用》。J.Dev.Stud。1994, 30, 303–334.42. 续,R.金融市场的长期依赖性。工程中的分形;斯普林格:柏林/海德堡,德国,2005年;第159-180.43页。巴顿,A.J.基于Copula的金融时间序列模型。在《金融时报系列手册》中;Mikosch,T.,Kreiss,J.P.,Davis,R.A.,Andersen,T.G.,Eds。;施普林格:柏林/海德堡,德国,2009年;第767-785.44页。杜兰特,F.Copulas,《尾部依赖及其在金融时间序列分析中的应用》。在理论和实践中,非聚集函数;H.巴斯廷斯,J.费尔南德斯,R.梅西亚尔,T.卡尔沃,编辑部。;智能系统和计算领域的进步排名228位;斯普林格:柏林/海德堡,德国,2013年;第17-22.45页。巴伯,D.贝叶斯推理和机器学习;剑桥大学出版社:英国剑桥,2012.46。多变量时间序列的格兰杰因果关系和路径图。J.经济。2007, 137,334–353.47. 为此,我们使用格兰杰的“因果关系强度”[6]。如果我们分别用∑和∑表示模型1和模型2中的误差方差,因果关系的强度将等于1-|Σ|/|Σ|. 我们使用的Geweke度量由ln(|∑|/|∑|)给出,它可以转换为因果关系强度的值。48

使用道具

60
mingdashike22 在职认证  发表于 2022-5-5 08:48:36 |只看作者 |坛友微信交流群
学系统。2012, 23, 47–59.26. Schreiber,T.测量信息传输。菲斯。牧师。莱特。2000, 85, 461–464.27. 林德纳,M。;维森特,R。;普里斯曼,V。;Wibral,M.TRENTOOL:一个Matlab开源工具箱,用于使用传递熵分析时间序列数据中的信息流。BMC神经症。2011, 12, 119.28. 伦加拉,M。;石黑浩。;库尼约希,Y。;《量化二元时间序列因果结构的方法》。内J.分叉。混沌2007,17903–921.29。安伯拉德,P.O。;Michel,O.J.J.关于有向信息理论和格兰杰因果图。J.计算机。神经症。2011, 30, 7–16.30. 巴内特,L。;巴雷特,A.B。;Seth,A.K.Granger因果关系和转移熵对于高斯变量是等价的。菲斯。牧师。莱特。2009, 103, 238701.31. Seth,A.K.Granger因果连接性分析的MATLAB工具箱。J.神经症。方法2010186262–273.32。Anil Seth密码。Aviable online:http://www.sussex.ac.uk/Users/anils/aks密码htm(2014年4月20日查阅)。33。该代码可在http://www.sohanseth.com/Home/publication/causmci(于2014年4月20日查阅)。当数据较短或分析的时间窗口较短时,使用置换比旋转更为普遍。35.Hlavackova Schindler,K。;帕卢斯,M。;维梅尔卡,M。;Bhattacharya,J.基于时间序列分析中信息理论方法的因果关系检测。菲斯。众议员2007,441,1-46.36。查韦斯,M。;Martinerie,J。;le van Quyen,M.非线性因果关系的统计评估:癫痫脑电图信号的应用。J.神经症。方法2003、124、113–128.37。克努特,克努特。;戈莱拉,A。;咖喱。;休瑟,K.A。;K.R.惠勒。;Rossow,W.B.用信息论揭示了相关气候变量之间的相关性。《地球太阳系统技术会议记录》(ESTC 2005),加利福尼亚州奥兰治县,美国,2005年1月38日。古尔·埃维奇,B。;艾格蒙特,J.J。

使用道具

59
mingdashike22 在职认证  发表于 2022-5-5 08:48:33 |只看作者 |坛友微信交流群
英国福水。;格雷顿。;太阳,X。;Schoelkopf,B.条件依赖的核心度量。美国国家统计局,2007年,20489-496.16。格雷顿。;英国福水。;Teo,C.H。;宋,L。;Schoelkopf,B。;斯莫拉,A.J.独立的核心统计专家;神经信息处理系统进展20:2007年第21届神经信息处理系统年度会议;麻省理工出版社:美国马萨诸塞州剑桥,2008.17。盖恩,我。;Janzing,D。;因果关系:目标和评估。J.马赫。学2010年决议,6 1–42.18。Sun,X.从多元时间序列评估非线性格兰杰因果关系。在机器学习和数据库中的知识发现方面;达勒曼,W.,戈塔尔,B.,莫里克,K.,编辑。;计算机科学课堂讲稿中的数字5212;施普林格:柏林/海德堡,德国,2008年;第440-455.19页。马里纳佐,D。;佩利科罗,M。;Stramaglia,S.Kernel Granger因果关系和动态网络分析。菲斯。牧师。E、 非线性软物质物理。2008, 77, 056215.20. Schoelkopf,B。;Tsuda,K。;Vert,J.P.计算生物学中的核方法。麻省理工学院出版社:美国马萨诸塞州剑桥,2004.21。黑斯蒂,T。;蒂布什拉尼,R。;弗里德曼,J.H.《统计学习的要素——数据挖掘、推理和预测》;斯普林格:纽约,纽约,美国,2009.22。Renyi,A.关于依赖性的测量。数学学报。阿卡德。Sci。挂。1959, 10, 441–451.23. 格雷顿。;斯莫拉,A。;布斯克,O。;赫布里奇,R。;贝利茨基。;奥加特,M。;村山,Y。;Pauls,J。;Schoelkopf,B。;Logothetis,N.依赖性测量的核约束协方差。《艺术情报与统计学会会刊》,巴巴多斯黑斯廷斯,2005年1月。霍夫曼,T。;Schoelkopf,B。;Smola,A.J.机器学习中的核心方法。安。统计数据2008,361171-1220.25。塞思,S。;普林西比,J.使用条件独立性的非参数度量评估格兰杰非因果关系。IEEE Trans。神经网络。

使用道具

58
kedemingshi 在职认证  发表于 2022-5-5 08:48:28 |只看作者 |坛友微信交流群
对所用术语的评论:“格兰杰因果关系”一词在文献中有一系列不同的含义,从统计测试到我们这里所说的“统计实用性”的同义词。在本文中,我们主要使用术语“格兰杰因果关系”作为特定依赖类型概念的名称,但每当我们量化这种依赖时,我们都会提到特定的衡量标准9。安伯拉德,P。;文森特,R。;米歇尔,O。;Richard,C.Kernelizing Geweke的格兰杰因果关系度量。2012年9月在西班牙桑坦德举办的IEEE信号处理机器学习国际研讨会(MLSP)上发表;第1-6.10页。安伯拉德,P.O。;Michel,O.J.J.格兰杰因果关系与定向信息理论之间的关系:综述。熵2012,15113–143.11。然而,这种混淆可能并不一定是不利的。如果我们将瞬时耦合解释为共享公共信息,我们可能会感兴趣地了解到,X与Y共享同步信息,而不管它们是否与Z共享同步信息。没有来自时间结构的方向性,我们无法区分直接和间接效应,这是在测量因果关系时包含次要信息的基本原理之一。12.格雷顿,A。;赫布里奇,R。;斯莫拉,A。;布斯克,O。;Schoelkopf,B.测量相关性的核方法。J.马赫。学2005年6月2075-2129.13号决议。格雷顿。;布斯克,O。;斯莫拉,A。;Schoelkopf,B.用Hilbert–Schmidt范数测量统计依赖性。算法学习理论;Springer Verlag:柏林/海德堡,德国,2005年;p、 63-77.14。太阳,X。;Janzing,D。;Schoelkopf,B。;一种基于内核的因果学习算法。2007年6月21日至23日在美国俄勒冈州俄勒冈州举行的第24届国际机器学习会议记录;ACM:美国纽约州纽约市,2007年;第855-862.15页。

使用道具

57
何人来此 在职认证  发表于 2022-5-5 08:48:25 |只看作者 |坛友微信交流群
整个交叉验证在计算上可能相对昂贵,因此,不必要的大网格是不可取的。感谢Kacper Chwialkowski(英国伦敦大学学院)对手稿进行的有用讨论和宝贵反馈。特别感谢Maciej Makowski对初稿进行校对并提供一般性意见。我们还想感谢Dynamic Devices AG的首席技术官Max Lungarella提供[28]的代码,尽管没有在本文所述的任何实验中使用该代码,但它为我们提供了有关转移熵和替代方法的重要见解。确认经济及社会研究理事会(ESRC)对系统性风险中心的支持(ES/K002309/1)。作者贡献所有作者都对研究的概念和设计、数据的收集和分析以及结果的讨论做出了贡献。利益冲突作者声明没有利益冲突。参考文献1。《因果关系:模型、推理和推理》;剑桥大学出版社:纽约,纽约,美国,2000年2月。格兰杰,C.W.J.因果关系检验:个人观点。J.经济。戴恩。控制1980,2329–352.3。诺伯特·W.《预测理论》。工程师的现代数学;贝肯巴赫,E.F.,Ed。;麦格劳·希尔:1956年,美国纽约州纽约市;第1.4卷。涉及经济反馈,格兰杰过程。知会控制。1963, 6, 28–48.5. Granger,C.W.J.通过计量经济学模型和交叉谱方法研究因果关系。计量经济学1969年,37424-438.6。Geweke,J.多个时间序列之间线性相关性和反馈的测量。杰姆。统计协会1982年,77304-313.7。Geweke,J.F.时间序列之间条件线性依赖和反馈的度量。杰姆。统计协会1984年,79907-915.8。

使用道具

56
可人4 在职认证  发表于 2022-5-5 08:48:21 |只看作者 |坛友微信交流群
虽然我们将它们推广到使用非线性预测,但如果我们采用交叉验证,我们仍然可以使用最优预测。在本文描述的应用中,我们使用了高斯核,其定义如下:k(x,y)=exp(-kx- ykσ)(57),线性核定义为k(x,y)=xTy。我们使用随机五次交叉验证来选择调节和核参数的最佳参数γ。设(xt,yt,zt),t=1。。。,n是时间序列。我们想计算Gy→xkz。基于给定的时间序列,我们创建了一个滞后(嵌入)等于p的学习集,并按照第2.1.3节的符号准备了一个学习集:(十一、wi)-圆周率-1) ,因为i=p+1。。。,n、 学习集随机分成五个大小相同的子集。对于每个k=1。。。,5.我们得到一个第k个验证集和一个第k个测试集,其中包含不属于第k个验证集的所有数据点。接下来,创建一个网格,给定参数γ和内核参数的值范围(值以对数刻度变化)。对于每个训练集和网格上的每个点,我们计算双重权重α*. 这些双重权重用于计算该特定网格点的验证分数和预测误差。对五个验证分数进行平均,以获得网格上每个点的预测误差估计值。我们选择与网格点相对应的参数,并对预测误差进行最小估计。最后,在给定最优参数的情况下,计算整个学习集的预测误差。如前所述,我们从中选择最佳参数的参数集分布在整个演算尺度上。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 04:28