楼主: 大多数88
660 26

[量化金融] 用局部神经网络检测功能时间序列的结构变化 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-11 05:23:27
局部修正的广义带深与预先固定的局部参数β引起的共振∈ (0,1)areRl=#{xj∈ X:cGDB(β)(xj,X)≤ cGDB(β)(xl,X)},(4)l=1。。。,n、 随后根据cGBD对原始观测值进行排序。让所有观察结果的组合样本中的统一秩为Rl,l=1,2。。。,n或Rx。。。,Rxn-Xi和Ry的银行。。。,易建联的建议1。我们建议进行适当的Wilcoxon检验,以检验生成两组给定函数序列的两个分布相等的假设。函数数据的β-局部(两个独立样本)Wilcoxon rang和统计采用形式β=n-mXi=1Rxi,(5)其中秩由局部参数β的局部cGBD产生。Liand Liu(2004)之后值得注意的是,由于长度过大7和任何深度函数,在处理两个样本X和YTitle时,可以计算组合样本X中的深度∪Y,假设使用所有观测值计算的经验分布,或仅假设其中一个样本X或Y计算该分布。如果我们观察到Xls的深度表示组合样本的中心,Yls的深度表示边缘,我们得出结论,Y取自散射较大的分布。一般来说,样本之间等级分配的差异表明潜在分布的形状存在各种差异,因此偏离了它们的性质(Liu等人,1999年)。在功能设置中,尺度差异意味着α- 从总体X中提取的中心区域包含的概率质量比从总体Y中提取的更小,因此Y比X更分散。局部性参数β表示我们比较总体的分辨率。它的范围从非常模糊的比较(参数接近1)到非常尖锐的比较(参数接近零)。

12
大多数88 在职认证  发表于 2022-5-11 05:23:30
从另一个角度来看,我们可以将统计数据(5)视为代表数据集中局部不对称性的集合(见Paindaveine和Van Bever,2013)。两个样本(5)值的差异表明,在聚集的局部不对称性方面存在差异,但同时在局部位置和规模方面也存在差异。注意,对于β=1,我们必须使用经典的Wilcoxon秩和检验,因此我们可以使用该检验的表格来获得临界值,并在出现联系的情况下使用众所周知的联系中断方案(见Jure^ckov\'a和Kalina(2012))。测试统计数据的大小值表明样本之间的分布差异。对于其他β值,我们计算每个点的深度。r、 t.在这一点上,经验分布是对称的。两个点可能具有相同的深度值,因此具有相同的等级。然而,我们预计从不同连续分布中提取的样本的秩和存在显著差异(不同的分布应以不同的局部不对称性为特征)。我们强调的差异与我们进行比较的溶液β参数有关。另一方面,β参数可被视为组合样本的数据剥离参数——一个对我们的程序污染具有预期灵敏度的参数。”测试的“力量”取决于基础分布的位置和规模之间的差异,也取决于适当功能空间中基础分布的“形状”差异。出于实际目的,我们建议在所选备选方案从优点角度对决策者特别重要的情况下,对“权力”进行蒙特卡罗评估。提案的优点属性取决于使用的功能深度属性。

13
大多数88 在职认证  发表于 2022-5-11 05:23:32
(Nieto Reyes和Battey,2016)和(Paindaveine和Van Bever,2013)提出的统计结果的样本性质和其他渐近性质。然而,请注意(Nieto Reyes and Battey,2016)并未考虑本地功能深度,而仅考虑全球版本。Flores等人(2015年)基于最大深度元素比较,构建了四种不同的统计数据来测量两个样本之间的距离。他们在功能数据分析的背景下提出了两个同质性样本测试。他们在考虑问题时没有使用局部深度的概念。我们的方法允许使用局部参数β,它表示我们比较人口的分辨率。它的范围从非常模糊的比较(参数接近1)到非常尖锐的比较(参数接近零)。研究人员可以根据所考虑的问题和经验调整位置参数。在多模式分销的情况下,我们的建议(5)优于他们的建议。8 Daniel Kosiorowski等人的提案2——检测结构变化。有一个函数参考样本X。。。,XM。我们想比较一下功能数据流。。。,YN,其中N>>M与我们的参考样本一起,即检测功能数据流中的结构变化。我们构造一个长度为L的移动窗口,然后依次测试X的均匀性。。。,XNand Yk。。。,Yk+L-1对于k∈ {1,…,N- L+1}使用统计(5)。我们的程序能够检测功能数据流中的结构变化。为了获得检验统计量的样本分布,并由此获得必要的P值,我们建议使用Vinod和de Lacalle(2009)提出的最大熵引导法,并在meboot R包中实现。

14
何人来此 在职认证  发表于 2022-5-11 05:23:36
注意,在时间序列设置中,由于观测值之间的时间依赖性,重采样,尤其是自举似乎是进行统计推断的唯一解决方案(见Shang(2016))。在我们研究的经验时间序列中,我们使用meboot R软件包生成自举样本,然后计算样本的Wilcoxon统计分布,以获得合适的p值。4提案的性质——模拟研究为了检查我们提案的有限样本性质,我们进行了模拟研究。为了检查我们的“静态”提案的有限样本属性(5),我们进行了广泛的模拟研究,涉及产生样本的分布的位置和/或规模和/或形状的各种差异。我们从相同的分布(代表零假设的情况)和两个类型相同但不同的w.r.t.位置和/或规模的分布中生成了两个样本。与Horv\'ath等人(2014年)和Didericksen等人(2012年)类似,我们考虑了由维纳过程和布朗桥产生的功能错误样本,将其分为1440和120个时间点(24小时分为1分钟和12分钟时间段)。我们考虑了大小相同和不同的样品。一般来说,在位置和规模上存在简单差异的情况下,我们的提议与Flores等人(2015)基于两个样本比较中的最大深度元素提出的提议具有可比性,但在存在多模态(样本之间的局部差异)的情况下,我们的提议明显优于Flores等人(2015)提出的提议。图3显示了在120个点处观察到的维纳过程生成的50条曲线的样本。图4显示了50条曲线的样本,这50条曲线是由两个维纳过程的5%混合产生的,这两个过程不同于w.r.t.位置。无花果

15
kedemingshi 在职认证  发表于 2022-5-11 05:23:41
5表示假设两个样本均来自与图3相关的群体的统计估计密度(5),图6表示替代方案下统计估计密度(5),其中第一个样本来自与图3相关的群体,第二个群体来自与图4相关的群体。很容易注意到,估计的密度与地理位置不同,因此可以用来区分不同的种群。进一步的结果和R代码可根据要求提供(我们进行了类似于asin Flores等人(2015)的敏感性分析)。为了检查拟议的结构变化检测程序,我们从以下模型中生成时间序列,这些模型在周期性属性建模的背景下具有经济合理性。我们使用函数自回归模型FAR(1),即Xn+1=ψ(Xn)+n+1,其中错误观察值Xnarecurves,ψ是一个线性算子,它将一条曲线转换成另一条曲线。标题因长度过大而被抑制90 200 400 600 800 1000 1200 1400-100-50 0 50 100FM深度Tx(t)FM。tr0%MedianFig。3在120个点处观察到的维纳过程生成的50条曲线样本。0 200 400 600 800 1000 1200 1400-100-50 0 50 100 150 200FM深度Tx(t)FM。tr0%MedianFig。4.50条曲线的样本,由两个维纳过程的5%混合物生成,不同于w.r.t.位置。500 1000 1500 20000.0000 0.0004 0.0008 0.0012 H9N=100带宽下的样本mWilcox统计密度估计值=244.7DensityQ(0.01)Q(0.1)Q(0.9)Q(0.99)图5假设两个样本都是从与Fig.3.0 500 1000 1500 2000 25000e+00 2e-04 4e-04 6e-04 8e-04 1e-03相关的总体中生成的样本mWilcox统计密度估计值H10N下的估计值=100带宽=331.1密度Q(0.01)Q(0.1)Q(0.9)Q(0.99)图。

16
大多数88 在职认证  发表于 2022-5-11 05:23:44
6备选方案下统计数据的估计密度(5),其中第一个样本来自与第三组相关的人群,第二个样本来自与第四组相关的人群。算子ψ被定义为ψ(X)(t)=Rψ(t,s)X(s)ds,其中ψ(t,s)是一个二元函数,假设满足| |ψ| | | | | |=Rψ(t,s)dtds。条件| |ψ| |<1确保了FAR(1)方程的平稳因果解的存在。因此,根据模型Xn+1(t)=Rψ(t,s)Xn(s)ds+生成FAR(1)数据生成过程序列n+1(t),其中n=1,2,N.我们使用了以下(Didericksen等人,2012年)的模拟研究设计。1.在实验1中,我们使用高斯核ψ(t,s)=C exp生成了100条曲线{-(t+s)},以及Didericksen等人(2012)的(8)类错误,以及使用核ψ(t,s)=C的100条曲线。图7给出了实验1的说明。我们把整个实验重复了100次。图9显示了实验1的模拟结果,使用了相应的函数箱线图和FM深度。2.在实验2中,我们使用具有适当常数C的高斯核生成了100条曲线,并从实验1中考虑的两个过程的混合中生成了100条曲线,但与Didericksen等人(2012)得出的误差项(8)的参数不同。图8给出了实验2的图示,图10给出了相应地使用功能盒形图和FM深度进行实验2模拟的结果。图11的左面板显示了一种情况下的样本密度估计(Hd0),其中样本为10 Daniel Kosiorowski等人0 20 40 60 80 100 120-10 0 10 20FM DepthtX(t)FM。tr0%中音20 40 60 80 100 1201 2 4调频深度Tx(t)调频。tr0%MedianFig。

17
kedemingshi 在职认证  发表于 2022-5-11 05:23:47
7.模式1.0 20 40 60 80 100 120-20中的结构变化检测-10 0 10 20FM深度Tx(t)FM。tr0%中音20 40 60 80 100 120-60-40-20 20调频深度Tx(t)调频。tr0%MedianFig。8结构变化检测模式2.0 20 40 60 80 100800 1000 1200 1400 1600 1800 2000 2200tX(t)0 20 40 60 80 100500 1000 1500 2000FM深度TX(t)FM。tr0%MedianFig。使用移动Wilcoxon统计对方案1中的结构变化进行了9100次检测。0 20 40 60 80 1001000 1200 1400 1600tX(t)0 20 40 60 80 100500 1000 1500 2000FM深度TX(t)FM。tr0%MedianFig。使用移动Wilcoxon统计量对方案2中的结构变化进行了10100次检测。生成于图12左面板上的工艺,该工艺又是两种工艺的混合。图11的右面板显示了样本密度估计(Hd1),其中第一个样本来自图12的左面板上呈现的过程的混合,第二个样本来自图12的右面板上呈现的过程的混合。估算的密度明显不同于w.r.t.的位置,因此我们的程序能够正确检测混合物类型的变化——考虑到两个样本中最深层的元素,我们的程序比Flores等人(2015)的建议要好得多。很容易注意到,我们的程序正确地检测到了第100次观察后出现的结构变化。图12展示了结构变化的非常有趣的例子,其中我们的建议(6)优于基于Flores等人介绍的统计数据的建议。

18
何人来此 在职认证  发表于 2022-5-11 05:23:50
(2015).结构变化与生成曲线的过程混合类型的变化有关。4.1提案的属性——实证示例1为了验证提案的实证有用性,我们根据服务所有者提供的真实数据,考虑了两项互联网服务的用户数量和页面浏览量。图1由于长度过长115000 6000 8000 90000e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04在Hd0N=100带宽=656Density-2000 2000 4000 6000 80000.000000.0000.00020 0.00030在Hd1N=100带宽=895.8density下的密度估计而抑制当前缝合图。11在HD0和Hd1下估计样本统计密度。0 20 40 60 80 100 120-10 0 10 20FM深度Tx(t)FM。tr0%中音20 40 60 80 100 120-20 0 60FM深度Tx(t)FM。tr0%MedianFig。12两种工艺是两种不同工艺的混合物。2013年服务1小时用户数的功能箱线图,图2显示了2013年服务2小时用户数的功能箱线图。0 50 100 150 200 250 300 350 150 200 250 350移动本地Wilcoxon统计,beta=0.8Indexstac。1Fig。13移动Wilcoxon统计用于服务1中的用户数,β=0.80 50 100 200 250 300 350 150 200 250 350移动本地Wilcoxon统计,β=0.6 indexstac。1Fig。14移动Wilcoxon统计用于服务1中的用户数,β=0.60 50 100 200 250 300 350 150 200 250 350移动本地Wilcoxon统计,β=0.4 indexstac。1Fig。15移动Wilcoxon统计服务1中的用户数,β=0.40 50 100 200 250 300 350 150 200 300 350 400移动本地Wilcoxon统计,β=0.2索引TAC。1Fig。16服务1中用户数量的移动Wilcoxon统计,β=0.2Fig。

19
能者818 在职认证  发表于 2022-5-11 05:23:55
13–16显示了根据局部参数β的选定值移动窗口计算出的提案行为,参考样本由前100个OB组成。人们可以注意到一个普遍的趋势,即稳定的统计值。经过深思熟虑的过程似乎趋于平稳。12 Daniel Kosiorowski等人4.2实证例2–产量曲线我们的第二个实证例将FDA引入产量曲线的建模和预测。收益率曲线源自无风险利率的概念,即为安全资产投资支付的理论价格。然而,在实践中,不存在无风险工具,无风险利率不能直接观察到,必须通过市场上交易的产品来近似,如国库券、国库券和公司债券、银行间贷款利率、远期利率协议或WAP等。从我们的观点来看,收益率曲线是到期时间τ的函数。收益率曲线形状的变化被认为是预期变化的标志,也是实际商业周期阶段变化的标志。不幸的是,人们无法观察到完整函数的形状,因为债券和其他利率衍生品的到期日期是固定的。这里还应该提到的是,关于收益率曲线形状的详细理论和影响它的因素还没有完全建立起来。产量曲线的估计通常以两种方式进行:在非参数设置下,通过线性或样条逼近,使用自举技术或使用参数方法(Diebold和Li,2006)。由于美国经济是全球经济变化的前兆,我们将注意力集中在美国收益率曲线上。在我们的研究中,我们使用了从2000-01-03年到2016-03-30年的每日观察美国收益率,期限在1个月到30年之间。为了检查我们的测试是否能够检测到金融危机,该子集分为两部分:1。

20
nandehutu2022 在职认证  发表于 2022-5-11 05:23:58
X-雷曼兄弟破产前(2000-01-03-2008-09-14),2。Y——自2008-09-15年次贷危机开始至今。这两个子集都被转换为FDA对象,并以傅里叶为基础进行描述(见图17)。在图17中,人们可以清楚地看到,由于全球经济商业周期阶段的变化,危机前后这两个捆绑包的最终形状(即斜率和曲率)是不同的。程序的下一步需要估计两个子集的cGBD。图18中的functionalboxplot显示了中值曲线(最深的位置),以及选定的α中心区域。超出α最高值的任何点都可能被视为异常值。如图18所示,危机前后收益率曲线形状的中心趋势是相同的,而外部曲线的形状和性质则显著不同。为了检查我们的程序是否能够检测功能时间序列结构的变化,该模拟的最后一步涉及计算滚动窗口方案中功能收益率曲线的局部Wilcoxon统计(方案2)。在该方案中,我们假设两个特定长度的窗口——参考窗口(简称ref)具有固定长度,最初包括从2000年1月开始的月度函数收益率曲线数据,相同大小的第二个窗口被固定数量的观察值移动。移位大小和样本长度保持不变。图19给出了长度为10、50和40个观测值的窗口在时间上移动10、20或30个点的结果。得到的结果显然取决于窗口大小。对于相对较大的窗口和部分重叠样本,当地Wilcoxon统计数据中的变化波动较小,人们可以将其与商业周期的各个阶段联系起来,例如:。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 13:43