楼主: mingdashike22
518 41

[量化金融] 聚类移动函数中值在层次结构鲁棒预测中的应用 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
71.2422
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
25194 点
帖子
4201
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Aggregated moving functional median in robust prediction of hierarchical
  functional time series - an application to forecasting web portal users
  behaviors》
---
作者:
Daniel Kosiorowski, Dominik Mielczarek, Jerzy P. Rydlewski
---
最新提交年份:
2018
---
英文摘要:
  In this article, a new nonparametric and robust method of forecasting hierarchical functional time series is presented. The method is compared with Hyndman and Shang\'s method with respect to their unbiasedness, effectiveness, robustness, and computational complexity. Taking into account results of the analytical, simulation and empirical studies, we come to the conclusion that our proposal is superior over the proposal of Hyndman and Shang with respect to some statistical criteria and especially with respect to robustness and computational complexity. An empirical usefulness of our method is presented on example of management of a certain web portal divided into four subservices. An extensive simulation study involving hierarchical systems consisted of FAR(1) processes and Wiener processes has been conducted as well.
---
中文摘要:
本文提出了一种新的非参数、鲁棒的层次函数时间序列预测方法。该方法与Hyndman和Shang的方法在无偏性、有效性、鲁棒性和计算复杂性方面进行了比较。考虑到分析、模拟和实证研究的结果,我们得出结论,在某些统计标准方面,尤其是在稳健性和计算复杂性方面,我们的建议优于Hyndman和Shang的建议。以某门户网站分为四个子服务的管理为例,说明了该方法的有效性。还对由FAR(1)过程和维纳过程组成的层次系统进行了广泛的仿真研究。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Computation        计算
分类描述:Algorithms, Simulation, Visualization
算法、模拟、可视化
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--

---
PDF下载:
--> Aggregated_moving_functional_median_in_robust_prediction_of_hierarchical_functio.pdf (1.46 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:层次结构 Hierarchical Applications UNBIASEDNESS epidemiology

沙发
nandehutu2022 在职认证  发表于 2022-6-1 12:02:49 |只看作者 |坛友微信交流群
分层功能时间序列的模糊预测中的聚合移动功能中值-预测门户网站用户行为的应用Daniel Kosiorowski、Dominik Mielczarek、Jerzy P.Rydlewski(通讯作者)2018年7月3日波兰克拉科夫波兰理工大学应用数学学院克拉科夫经济大学统计系;摘要本文提出了一种新的非参数、鲁棒的层次函数时间序列预测方法。该方法与Hyndman和Shang的方法在运行偏差、有效性、鲁棒性和计算复杂性方面进行了比较。考虑到分析、模拟和实证研究的结果,我们得出结论,在某些统计标准方面,尤其是在稳健性和计算复杂性方面,我们的建议优于Hyndman和Shang的建议。以某门户网站分为四个子服务的管理为例,说明了该方法的实用性。还进行了涉及FAR(1)过程和维纳过程的分层系统的广泛仿真研究。关键词:函数数据分析、层次时间序列预测、移动函数中值、稳健预测、预测协调、自下而上方法1简介在计量经济学建模领域,我们经常遇到一个动态经济现象系统,其组成部分具有强加的层次结构。作为宏观经济的一个例子,让我们考虑一个国家向产品和服务集团及子集团的出口,以及向其地理区域或行政单位的出口。

使用道具

藤椅
能者818 在职认证  发表于 2022-6-1 12:02:52 |只看作者 |坛友微信交流群
作为一个微观经济学的例子,让我们以一家销售化妆品的网上商店为例,该商店分为所谓的目标群体,另外还分为地理区域、性别或年龄组。统计和计量经济学文献(见[12、13、14、41])考虑了在不同层次或节点上获得的预测的协调,并考虑了在不同层次或节点上获得的预测的组合。特别是,通过协调,我们指的是预测值的预期属性,即在某个级别上以节点获得的预测之和等于在上层的相关节点中获得的预测。在较低级别和较高级别获得的预测之间的差异可能是由于不同的测量方法、不同的方法或用于不同层次层次结构的测量精度造成的。值得注意的是,在经济学中,有许多现象可以描述为某些连续变量的函数,例如效用或收益曲线、资本流动、互联网交易[10、18、19、32],或昼夜的空气污染强度。关于最后一个问题,由于空气污染对人类健康有负面影响,精确的空气污染预测可用于在一定时期内最大化某些当地社区的综合效用,从而实现社会福利的最大化。这是一个事实的结果,即在一定时期内的效用函数是与预测质量相关的成本的函数。在互联网服务管理的背景下,人们可能希望与安全相关的效用最大化具有某种稳健性。

使用道具

板凳
能者818 在职认证  发表于 2022-6-1 12:02:55 |只看作者 |坛友微信交流群
在这里,我们的意思是安全系统对“不是快速而是系统性”入侵系统的鲁棒性。这种现象在时间上的演变自然可以用函数时间序列来描述,即按时间索引的函数族。如果时间序列还表现出层次结构(例如,分为子服务的web Portal),则自然会考虑层次功能时间序列(HFTS)[35]。HFTS是一个功能性时间序列,根据相关层级进行分组。预测HFTS意味着为所有级别的所有节点联合准备预测。稳健的HFTS预测方法通常是指一种方法,尽管基础模型受到小干扰或基础数据集受到小污染,但该方法仍能对整个层次结构产生“良好”的预测。污染包括用形状或大小函数异常值替换所考虑的数据集的某一部分(见[34])。在HFTS价值解释的背景下,有必要区分影响层级体系整体结构的结构变化(作为金融崩溃、特殊政治事件的影响)和“常见”异常值,它们也可以被视为重要信息的“包”,但规模/价值重要性较小。请注意,在获得层次结构每个层次的预测后,通常会出现一个自然的问题–如何正确调整在每个层次上获得的信息,以便获得所有层次的全局重新协调预测?在此背景下,文献中提出了几种HFTS预测方法。自下而上的方法涉及在开始时进行基础预测(在层次结构的最底层以节点为单位)。然后,对获得的预测进行聚合,以获得层次结构上层节点的预测。

使用道具

报纸
可人4 在职认证  发表于 2022-6-1 12:02:58 |只看作者 |坛友微信交流群
聚合的一种特殊形式与所考虑的节点或水平的大小比率的历史数据有关。自顶向下方法在层次结构的顶层绘制以节点为单位的序列预测。随后进行分解。上述方法通常是组合的,即在层次结构的某个中间级别对节点进行预测,然后聚合生成层次结构较高级别的预测,而分解生成较低级别的预测。应该强调的是,如果我们独立地在各个层级进行预测,那么较低层级的预测总和通常不会与较高层级的预测相加【12】。请注意,上述所有方法都没有考虑层次结构级别节点之间的依赖结构(例如相关性结构)。在Shang和Hyndman【35】的研究中,作者考虑了在层次结构的所有层次上对节点进行重新协调预测,将Hyndman等人【12】提出的方法扩展到功能时间序列案例。该方法考虑了水平之间的已知依赖结构,并使用根据经验数据计算的预测分散估计。进行对账的基础是应用某种形式的广义最小二乘法,这是一种众所周知的非稳健性方法。

使用道具

地板
kedemingshi 在职认证  发表于 2022-6-1 12:03:01 |只看作者 |坛友微信交流群
他们使用相关的bootstrapmethod评估预测的不确定性,该方法适用于依赖时间的观测。在进行了几次模拟和实证研究之后,我们旨在提出一种概念上简单的替代方法,该方法对函数化者具有鲁棒性,并且计算量不像函数化者那么大。我们使用聚合移动功能中位数–移动功能中位数的功能中位数,以获得所有考虑层次的重新协调预测。我们的预测方法似乎是稳健的toshape以及震级异常值,并且在计算上易于处理。本文的主要目的是提出一种有效、稳健且易于计算的HFTS预测方法。我们还成功地将该方案应用于实际数据,即监控分为四个子服务的Internet服务。本文的其余部分组织如下:第2节介绍了我们在考虑中使用的一些理论概念和结果。第3节介绍了我们的建议。第4节显示了我们提案的一些特性。第5节介绍了一项模拟研究,其中我们的方法已应用于由一阶函数自回归过程(FAR(1))和维纳过程组成的人工层次系统。第6节介绍了我们的方法在分析门户网站用户行为方面的应用,因为我们希望在实际观测数据上测试我们的预测方法。最后,我们以第7节给出的一些结论来结束本文。该方法的实现以及所考虑的数据集可在免费R包DepthProc中找到【17】。2理论框架在对前一节中提出的问题进行描述之后,将一些经济现象视为函数是有利的。

使用道具

7
可人4 在职认证  发表于 2022-6-1 12:03:04 |只看作者 |坛友微信交流群
最近开发了功能数据分析(FDA)方法(有关详细信息,请参见[3、8、10、32、35])。根据前面提到的研究,我们确实将随机曲线视为[0,T]上的实值函数,其中已知。随机曲线是空间L([0,T])的元素,这是一个具有内积hx,yi=Rx(T)y(T)dt的可分离Hilbert空间,并配有Borelσ-代数[3]。函数时间序列是函数随机变量的时间索引序列。在实证研究中,我们经常在不同的“水平”上观察功能序列的轨迹,例如,单个家庭、城镇和地区的昼夜电力需求,或者一个城镇、一个州和一组州的空气污染。这些数据对所研究的现象施加了自然的层次结构。2.1功能深度功能深度概念【28,29】在我们的考虑中至关重要,因为我们使用该概念来定义相关的功能中值。为了确定曲线x相对于函数样本XN的修正带深度(MBD,见[25]),我们需要在域中引入一个集合度量,该集合度量函数相对于考虑样本的中心性。我们考虑一个N个函数的例子XN={x,…,XN}。让我们定义A(x;xi,xi)={t∈ [0,T]:minr=i,ixr≤ x(t)≤ maxr=i,ixr}。注意,出于计算原因,我们只考虑带被两个函数xind xi限制的情况;然而,洛佩斯·平塔多(López Pintado)和罗莫(Romo)[25]定义了更多限制曲线的BD。当x在相应的频带内时,MBD测量“时间”的比例,即MBD(x | XN)=N(N- 1) X1≤i<i≤Nλ(A(x;xi,xi))λ([0,T]),(2.1),其中λ(·)表示勒贝格度量。

使用道具

8
能者818 在职认证  发表于 2022-6-1 12:03:07 |只看作者 |坛友微信交流群
MBD感官中最深的曲线在形状上可能与样本中的大多数曲线不同,但在空间上接近平均值。曲线x相对于函数样本x的广义带深(GBD,见[24])在以下意义上会降低曲线位于中心的频率。GBD(x | XN)=N(N- 1) X1≤i<i≤NCI(x;xi,xi)λ([0,T]),(2.2),其中CI(x;xi,xi)=maxtS{λ(tS):minr=i,ixr≤ x(t)≤ maxr=i,ixr,t型∈tS},其中tS [0,T]是一个紧区间。因此,CI(x;xi,xi)是最长的连续间隔,其中x属于函数xind xi限制的频带。请注意,以下不等式始终为真:GBD(x | XN)≤ MBD(x | XN)。从前面的公式可以推断,GBD能够区分形状不同的函数,而MBD能够区分大小不同的函数。还值得注意的是,靠近样本中心且形状不差的函数具有较大的HGBD和MBD值,而接近样本中心但形状差的函数与MBD值相比具有较小的GBD值。大GBD值与commonshape的函数有关。样本中的曲线形状越不规则,则lessMBD越合适,而GBD越合适。我们建议您对所分析的功能类型进行预分析,以确定哪个功能深度最相关。对给定曲线w.r.t函数样本获得的各种函数深度进行比较,也可以提供基本信息。然后,可以构造深度的嵌套区域,即consideri。e、 GBD(x | XN)≥ α. 关于所考虑的功能深度的功能中值是最核心的观察结果。

使用道具

9
能者818 在职认证  发表于 2022-6-1 12:03:10 |只看作者 |坛友微信交流群
现在假设我们可以使用N函数,即XN={xi(t),i=1,2,…,N}和t∈ [0,T]。设FD(y | XN)表示函数y(t)相对于样本XN的样本函数深度(在本文中,我们只考虑F D=MBD或F D=GBD)。样本中值w.r.t.所考虑的功能深度可定义为:D(y | XN)=arg maxi=1,。。。,NF D(xi | XN)。如果不止一个函数达到深度最大值,则函数中值定义为放置在此类函数凸包中的函数的平均值【17】。请注意,由于可以考虑不同的功能深度,因此可以获得不同的功能中介。随后,我们使用移动函数中值^xn+1(t)=MEDF D(Wn,k),其中Wn,kis是长度为k的移动窗口,其末端在力矩n中,即Wn,k={xn-k+1。。。,xn}。2.2 HFTS预测的参考方法虽然文献中有几种专门的和更系统的HFTS预测方法,但我们采用Shang和Hyndman的方法作为参考方法,主要是因为其数学优雅、良好的统计特性和全面性。他们的方法源自他们之前的研究(参见,即[35]),其中考虑了完整的层次结构。最近对该方法进行了修改,使用广义指数平滑技术对最分解的函数时间序列进行平滑处理,以获得更稳健的预测值(详情请参见[21])。Shang和Hyndman的死亡率预测方法使用功能主成分分析,以便在每个层面上进行功能主成分回归,其中主成分得分的时间序列预测是通过有效但非稳健的单变量时间序列预测方法获得的,即Hyndman和Shang[11]方法(另见[15])。

使用道具

10
可人4 在职认证  发表于 2022-6-1 12:03:13 |只看作者 |坛友微信交流群
再调和预测是在所考虑的层次结构的每个层次上,对函数时间序列所获得的预测的某种广义最小二乘估计。然后,利用矩阵方程对每个时刻的层次时间序列的结构进行建模,矩阵方程考虑了所有层次的所有时间序列,尤其是来自层次最低层次节点(节点)的最分解序列的向量。因此,该方法具有调节预测的直接内部机制。有关Shang和Hyndman方法的更详细描述,请参见他们的论文【35】。在他们提案的属性中,有一个聚合一致性,即预测满足聚合约束,并且是平均无偏的(见[35])。尽管如此,我们发现的方法在计算上要求很高,而且相对复杂(稀疏线性最小二乘问题,大矩阵的广义逆)。我们的方法没有后者的缺点。3我们的建议在第一步中,我们计算与最低层次每个节点的GBD、MBD或其他功能深度(FD)相关的移动功能中值,即计算MEDF D(Wn,k)。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-18 00:59