楼主: nandehutu2022
800 29

[量化金融] 基于条件二阶矩的新肥尾正态性检验 [推广有奖]

21
能者818 在职认证  发表于 2022-6-11 03:35:26
实证示例:市场股票回报的案例研究在本节中,我们将提出的框架应用于股票市场回报,形成基本的健全性检查验证。在此之前,让我们对20-60-20规则与金融时间序列之间的关系进行评论。假设X描述了金融资产回报率,我们可以使用20/60/20比率分割人口,并检查每个子集的回报行为。如果仅在极端事件中观察到非正态扰动,则20/60/20突变可能识别状态切换并提供ago od空间聚类;这可能与一种流行的金融风格有关,即平均金融资产回报率趋于正常,但极端回报率并非如此——详情请参见Cont(2001)和Sheikh and Qiao(2010)。应该强调的是,据作者所知,这一特性与数据非正态性之间的联系以前在文献中没有讨论过。验证这一假设的最简单方法是在不同时期采集s-tock r回归样本,绘制分位数-分位数图(标准正态asa参考分布),并检查聚类是否准确。

22
nandehutu2022 在职认证  发表于 2022-6-11 03:35:29
在图4中,我们展示了两种主要美国股票的典型结果,即GOOGL andAAPL和两种主要股票指数,即S&P500和DAX;我们在2015年10月至2018年1月的不同时间间隔内推出了长度为250的时间序列。数据通过R tidyquant软件包从Yahoo Finance下载。基于新肥尾正态性检验19-3.-2.-1 0 1 2 3-0.04-0.02 0.00 0.02GOOGL:正常Q-Q图(编号:obs=250)[日期范围:2016年-03-21- 2017-03-16] 理论量Sample QuantileTest。N=8.042(p-值0)-3.-2.-1 0 1 2 3-0.04-0.02 0.00 0.02 0.04 0.06AAPL:正常Q-Q图(编号:obs=250)[日期范围:2017年-01-04- 2017-12-29]理论量Sample QuantileTest。N=9.255(p-值0)-3.-2.-1 0 1 2 3-0.06-0.04-0.02 0.00 0.02DAX:正常Q-Q图(编号:obs=250)[日期范围:2015年-10-29- 2016-10-24]理论量Sample QuantileTest。N=3.312(p-值0.001)-3.-2.-1 0 1 2 3-0.03-0.02-0.01 0.00 0.01 0.02SPX:正常Q-Q图(编号:obs=250)[日期范围:2016年-04-07- 2017-04-03]理论量Sample QuantileTest。N=9.289(p-值0)图4。sizen=250的各种财务回报的分位数-分位数图。虚线对应20%和80%的数量。人们可以在每个集群中看到不同的数据行为:虽然中心区域与正态分布一致,但尾部区域与正态分布不一致。从图4中我们可以看到,这种划分非常准确:在M集中观察到非常好的正态fit(观察值的中间60%),而在尾集L和R(观察值的底部和顶部20%)中的fit很差。通过采取不同的样本量、不同的时间范围和不同的库存,我们可以确认该属性是系统性的,即。

23
可人4 在职认证  发表于 2022-6-11 03:35:33
结果几乎总是与图4所示的结果相似。虽然资产收益分布中存在厚尾现象在金融界是众所周知的现象,但令人惊讶的是,大约40%的数据都可以看到非正态行为。此外,teststatistic N可用于正式量化这一现象并测量飞机的重量:尾部的条件标准差越大(相对于中部),尾部越胖。在下文中,我们将重点评估测试统计数据在市场数据上的表现。我们进行了一项简单的实证研究,并从2000年1月1日至2018年5月5日期间拥有完整历史数据的2018年6月16日在标准普尔500指数交易所上市的所有股票中获取回报。这是我们获取381只股票的完整数据(4610每日调整收盘价回报)的方法。接下来,对于给定的样本大小n∈ {50、100、250}我们将收益分成长度为n的不相交集合,对于每个子集,我们将n的值与图2中给出的相应经验20 DAMIAN JELITO和MARCIN PITERAquantiles进行比较。更准确地说,如果计算值大于经验值F,我们将执行右侧统计检验并拒绝正态性(空)假设-1n(1-α) ,对于α∈ {1%, 2.5%, 5%}.为了评估测试性能,我们将结果与其他ben-chmarknormality测试进行比较:Jarque–Bera测试、Anderson–Darling测试和Shapiro–Wilk测试。虽然收益的非正态性是众所周知的事实,而且所有测试框架都应该显示出良好的性能,但我们想检查我们的框架是否会产生一些新的有趣的结果。我们检查了正态性假设,并计算了用于性能评估的两个补充指标:-统计T给出了给定测试的总拒绝率。

24
可人4 在职认证  发表于 2022-6-11 03:35:36
它对应于在给定显著水平上拒绝正态性假设的数据比例;它是被拒绝的数据子样本与所有数据子样本的比率。-统计U给出了给定测试的唯一拒绝率。它对应于仅通过考虑检验(四项检验中的一项)在给定显著水平上拒绝正态性假设的数据比例;它是唯一拒绝的数据子样本与所有数据子样本的比率。表le4给出了所有n和α值的组合结果。-0.05 0.00 0.050 5 10 15 20CELG:平滑密度(nr.obs=250)[日期范围:2014年-11-28- 2015-11-24]N=250带宽=0.005225DensityKDE fitNormal fitquantiles-3.-2.-1 0 1 2 3-0.06-0.04-0.02 0.00 0.02 0.04 0.06CELG:正常Q-Q图(编号:obs=250)[日期范围:2014年-11-28- 2015-11-24]理论量Sample QuantilesJB=3.96(p-值0.108)AD=0.7(p-值0.065)SW=0.99(p-值0.227)N=2.67(p-值0.007)图5。仅测试N的就业前时间序列在1%的水平上拒绝了正态性。KDE fit对应于通过核密度估计获得的经验密度,而正态fit对应于标准正态fit。对应于20/60/20比率的经验分位数用虚线标记。我们可以看到,统计数据N表现得很好,并给出了所有选择N的最佳结果。令人惊讶的是,我们的测试框架允许在其他测试失败的情况下,在e上检测非正常行为:测量结果U在所有情况下都是重要的。例如,对于n=50和α=5%,U的值等于5.1%——这相当于几乎11%的所有拒收样品。对于n=250,结果尤其引人注目,其中正常假设在几乎所有情况下都被拒绝(约90%)。

25
nandehutu2022 在职认证  发表于 2022-6-11 03:35:39
而基于oneNEW FAT-TAIL NORMALITY TEST的21Desc nr ru nsαn拒绝JB AD SW NT35052 1.0%50 31.5%25.9%17.3%23.2%25.9%U 1.9%0.6%0.3%3.1%T35052 2.5%50 39.6%32.4%22.9%28.3%32.5%U 2.4%0.9%0.3%T35052 5.0%50 47.9%38.6%29.1%33.7%39.6%U 2.4%1.3%0.4%5.1%T17526 1.0%100 52.8%45.2%31.8%41.3%46.1%U 2.2%0.6%0.3%4.4%T17526 2.5%100 61.3%52.9%38.8%47.6%54.3%U 2.2%0.7%0.2%5.1%T17526 5.0%100 68.4%59.7%45.7%53.4%61.3%U 2.2%0.2%5.3%T6858 1.0%250 88.5%82.1%71.2%79.3%85.4%U 1.0%0.4%0.1%3.8%T6858 2.5%250 91.8%86.8%77.7%83.7%89.4%U 0.7%0.2%0.1%3.0%T6858 5.0%250 93.9%89.7%82.4%86.9%92.0%U 0.5%0.2%0.0%2.5%表4。该表包含marketdata的性能测试结果。列Desc给出了性能度量的名称,nr runs表示为给定n创建了多少子样本,值α表示置信水平,列rejects表示至少有一个测试拒绝了正态性假设的子样本的比率。字母JB、AD、SW和N分别指Jarque–Bera测试、Anderson–Darling测试、Shapiro–Wilk测试和N测试。最佳性能以粗体标记。可能会认为,对于如此大的样本量,三个经典测试应该检测出所有异常,但OUR测试仍然唯一地拒绝了多个样本的正态性。对于α=1%,额外262个样本的正态性被拒绝(占总体的3.8%)。为了透明,在图5中,我们展示了发生这种情况的示例数据子集。7、结束语和其他应用在本文中,我们已经证明,(3.1)中引入的检验统计量N可用于参考分布中心测量尾部的重量,并可作为有效的拟合优度正态检验统计量。

26
nandehutu2022 在职认证  发表于 2022-6-11 03:35:42
检验统计量N基于条件s-二阶矩,在市场金融数据上表现良好,允许在其他基准测试失败的情况下检测非正常行为。正如导言中所提到的,大多数实证研究表明,应谨慎选择正态性检验,因为它们的统计功效取决于上下文。我们的建议被证明在假设真实分布是对称的情况下具有最好的测试能力,并且有22条DAMIAN JELITO和MARCIN PITERAtails比正常分布更胖或更瘦。应该注意的是,我们的测试实际上是基于隐式分布对称性假设。事实上,在(3)中,左右尾翼的冲击是以相同的重量来考虑的。然而,这很容易推广,例如,只考虑其中一个尾部方差;我们稍后对此发表评论。在定理5.1中,我们证明了在正态零假设下,N的渐近分布是正态的。这使我们能够研究足够大样本的喷射间隔形状。为了得到这个结果,我们在Emma5.5中推导了条件样本方差的渐近分布。此外,我们还表明,20-60-20规则解释了与尾部非正常行为相关的财务风格事实,并提供了令人惊讶的资产回报时间序列准确聚类。令人惊讶的是,近40%的观测结果都显示出非正态性。综上所述,我们认为基于条件二阶矩的尾部碰撞试验非常有前景,并为基于三阶矩和四阶矩的经典框架提供了一个很好的替代方案。例如,可以使用Jaworski和Pitera(2016)中的结果确定检验统计量N的多变量扩展,例如,评估使用相关性结构进行依赖建模的充分性。

27
nandehutu2022 在职认证  发表于 2022-6-11 03:35:45
此外,利用Jaworski和Pitera(2017)的结果,这可以扩展到任何多元椭圆分布。N的构造说明了如何使用条件二阶矩进行统计。事实上,我们可能会引入其他各种统计数据,这些统计数据在虚假的分布假设下进行检验。让我们举几个例子:-我们可以通过考虑以下测试统计数据之一,仅测试中部的(左)低尾撞击:=^σL- σMσ√n、 编号:=^σL- ^σM^σM√n、 -对于任何基于分位数的条件集A和B,以及任何椭圆分布,可以引入statisticN:=σAσB-λ√n、 式中λ∈ R是一个常数,取决于定义条件集和基础分布的分位数。假设A=L和dB=R(整个空间),我们得到尾部色散和整个色散之间的比例。在这种特殊情况下,在正常框架下,我们得到λ=1-Φ-1(0.2)φ(Φ-1(0.2))0.2-(φ(Φ-1(0.2))0.2;详情见(Jaworski和Pitera,2016年,第3节)。基于23的新肥尾正态性检验注意,在正态性假设下,所有建议的统计数据都是关键量,这有助于进行简单有效的假设检验;可以使用与定理5.1中所述类似的推理来推导所有统计数据的共有分布。附录A.正规化常数的闭式公式本节,我们给出了定理5.1中正规化常数ρ的闭式公式。为简洁起见,我们省略了详细的计算,只给出结果。为了简化符号,对于任何γ∈ [0,1],我们设置xγ:=Φ-1(γ).

28
能者818 在职认证  发表于 2022-6-11 03:35:48
然后,对于任何A=A[α,β],标准化的第二、第三和第四条件中心矩由m(2)A给出:=1+xαφ(xα)- xβφ(xβ)β- α、 m(3)A:=(xα)φ(xα)- (xβ)φ(xβ)β- α+2φ(xα)- φ(xβ)β- α、 m(4)A:=3+(xα)φ(xα)- (xβ)φ(xβ)β- α+3xαφ(xα)- xβφ(xβ)β- α.此外,标准化条件均值、条件方差和条件峭度等于|uA=φ(xα)- φ(xβ)β- α、 σA=m(2)A- (|uA),|κA=m(4)A- 3(|uA)+6(|uA)m(2)A- 4uAm(3)A(¢σA)。此外,回想一下q=Φ(x),w这里x是方程的唯一负解-xΦ(x)- φ(x)(1- 2Φ(x))=0。现在,我们准备给出ρ的闭式公式;参见推论A。1、推论A.1。理论5.1中的归一化常数ρ由ρ得出:=sτLσ+4τMσ+τRσ-4(C+C)~q(1- 2q)+2Cq,回想一下,对于α=0或β=1,我们遵循约定0·±∞ = 0.24 DAMIAN JELITO和MARCIN Piterahere∈ {L,M,R}我们有τAσ=(β- α)(β - α) (|σA)(|κA- 1) + α(1 -α)(xα- uA)- σA+ β(1 - β)(xβ- uA)- σA- 2α(1 - β)(xα- uA)- σA××(xβ- uA)- σA,常数C、C和C=~q给出的注意(xq- uL)- σL(x▄q+▄uM)- σM- q(1- q)(xq- uM)- σM(xq- uL)- σL,C=▄q(x▄q+▄uR)- σR(xq- uM)- σM- q(1- q)(x▄q+▄uM)- σM(x▄q+▄uR)- σR,C=-q(x▄q+▄uR)- σR(xq- uL)- σL.ρ的值大约等于1.7885。资助第二作者的部分工作由波兰国家科学中心通过项目2016/23/B/ST1/00479提供支持。参考Alexander,C.(2009),《市场风险分析,金融量化方法》,第1卷,John Wiley&Sons。Anderson,T.W.和Darling,D.A.(1954),“对幸福感的检验”,《美国统计协会杂志》49(268),765–769。Brockwell,P.和Davis,R.(2016),《时间序列和预测导论》,《斯普林格统计文本》,斯普林格国际出版社。续,右。

29
kedemingshi 在职认证  发表于 2022-6-11 03:35:51
(2001),“资产回报的经验性质:程式化事实和统计问题”,定量金融1(2),223–236。Desgagn'e,A.和Lafaye de Micheaux,P.(2018),“基于2ndpower偏度和峰度的Jarque Bera正态性检验的一种强大且可解释的替代方法,使用APD家族的Rao分数检验”,《应用统计杂志》45(13),2307–2327。Ferguson,T.(1996),大样本理论课程,斯普林格科学+商业媒体多德雷赫特。Hair,J.、Black,W.、Babin,B.和Anderson,R.(2013),《多元数据分析:皮尔逊新国际版》,皮尔逊教育有限公司。Henze,N.(2002),“多元正态性不变检验:评论”,统计论文43(4),467-506。Hyndman,R.J.和Fan,Y.(1996),《统计数据包中的样本分位数》,美国统计学家50(4),361-365。基于25Jarque,C.M.和Bera,A.K.(1980),“回归残差的正态性、同方差性和序列独立性的有效检验”,《经济学通讯》6(3),255–259。Jaworski,P.和P itera,M.(2016),“20-60-20规则”,离散和连续动力系统系列B 21(4)。Jaworski,P.和P itera,M.(2017),“关于椭圆分布条件协方差矩阵的说明”,统计与概率字母129,230–235。Johnson,N.L.、Kotz,S.和Balakrishnan,N.(1994),《连续单变量分布》,第一卷,Wiley&Sons,纽约。Kaufman,L.和Rous seeuw,P.J.(2009),《在数据中发现g组:聚类分析导论》,第344卷,John Wiley&Sons。Madansky,A.(2012),《在职统计学家处方》,施普林格科学与商业媒体。McNeil,A.J.、Frey,R.和Embrechts,P.(2010),《定量风险管理:概念、技术和工具》,普林斯顿大学出版社。Nadarajah,S。

30
何人来此 在职认证  发表于 2022-6-11 03:35:54
(2005),“广义正态分布”,应用统计学杂志32(7),685–694。Romao,X.,Delgado,R.an d Costa,A.(2010),“正态性单变量拟合优度检验的经验幂比较”,《统计计算与模拟杂志》80(5),545–591。Romesburg,C.(2004),《研究人员聚类分析》,卢鲁出版社。Ser Fling,R.(1980),《数理统计近似定理》,概率和数理统计中的Wiley级数,Wiley&Sons,纽约。Sheikh,A.和Qiao,H.(2010),“市场回报的非正态性:资产配置决策的框架”,《另类投资杂志》12(3),8–35。Stigler,S.M.(1973),“修剪平均值的渐近分布”,Ann。统计学家。1(3), 472–477.Thadewald,T.和B¨unin g,H.(2007),“Jarque–Bera检验及其检验常模性的竞争对手–权力比较”,《应用统计学杂志》34(1),87–105。Thode,H.C.(2002),正态性测试,Marcel Dekker。Tumlinson,S.、Keating,J.和Balakrishnan,N.(2016),“扩展指数幂分布的线性估计”,《统计计算与模拟杂志》86(7),1392-1403。Wilk,M.B.和Shapiro,S.S.(1965),“正态性方差检验分析(完整样本)”,Biometrika 52(3-4),591-611。杰吉隆大学数学研究所,洛贾西耶维奇6号,30-348Cracow,PolandE邮箱:damian。jelito@im.uj.edu.plE-邮件地址:marcin。pitera@im.uj.edu.pl

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:07