楼主: mingdashike22
1422 31

[量化金融] 天气导数的状态转换温度动力学模型 [推广有奖]

11
能者818 在职认证  发表于 2022-6-10 10:37:13
e去季节化温度()ISASSUMEDTOBEDRIVENBYTWO随机性来源:阿马尔科夫过程和列维过程。我们假设基本制度下的平均回归率为常数。基于温度的典型行为,建立了描述温度动态的状态切换随机模型。is模型可用于对天气衍生品进行定价。假设ebase制度模型遵循一个具有时变波动率的均值回归随机过程。e基础区域的剩余物被重新利用,并由巴西工艺产生。至e客观地捕捉温度残差的非正态性(见图, , , 和 和表), 什叶派残余通过列维过程捕捉ed状态。通过比较其子类(正态逆高斯分布、双曲分布和方差伽马分布)的广义双曲分布,我们能够第二,可以模拟剩余数据不对称和重尾的最佳分布。作为我们的rst区域切换模型,我们称之为时变均值回复L'evy(TML)区域切换模型。提出的模型非常适合捕捉温度的动态变化。在后半部分中,非季节化温度动力学的proposeTML模型如下所示()=Mt:Mt=Mt+MMtt, 有可能Lt:Lt=L+Lt, 有可能()哪里MMt是指基准日波动率随时间的去季节化,以及L是时的波动性ed regimesand地区是将去季节化温度逆转至长期平衡水平A的基本状态中去季节化温度的平均逆转率er去季节化温度具有dri从这种平衡中分离出来。

12
能者818 在职认证  发表于 2022-6-10 10:37:16
t~(0,)是标准布朗运动。t是一个L'evyproceswhichisc'adl'ag、自适应、实值的一般L'evy过程,具有独立、平稳的增量和随机连续,以及t是当时的去季节化温度.提案3。如果取消季节化的日平均温度()遵循模型(9),然后给出显式解()=M():M()=(-1)κt+∫tt-1.()κ(t-s)()L():L()=(-1)+L+∫tt-1.L()()证据确定基本区域过程的随机积分需要一种参数变化方法来阐明一个新的函数[(),]=W()-κt.通过It^o引理,可以找到新函数的导数。((),)=--κtM()()+-κtM()=--κtM()()+-κtM()+M()()=-κt()()((),)=M()-κt=(-1)+tt-1.()-κs()M()=(-1)κt+tt-1.()κ(t-s)()()对于shied制度L()=L+()tt-1.L()=tt-1.L+t()()=(-1)+L+tt-1.()()4、温度数据分析e每日最高和最低表面温度数据取自Bole和Tamale的气象测量站。Bole和Tamale发表在《国际随机分析杂志》上T : 日平均气温的描述性统计。平均中值模式标准最小最大偏度峰度Hurst指数PvalueBole. . . . . . . . . . 塔马利. . . . . . . . . . T : Bole和Tamale剩余异方差的Engle检验。测试统计p值. 塔马利. 加纳北部地区(加纳最热的地区)。Bole和Tamale分别是Bole和Tamale的地区首府。在加纳,天气数据的主要来源是加纳气象局。e采样周期从// 到// 由以下部分组成 观察。

13
何人来此 在职认证  发表于 2022-6-10 10:37:19
e根据De计算每日最高和最低温度的平均值尼廷.e检查原始数据是否有缺失数据,以避免历史数据中出现缺口。根据丢失数据的大小(丢失数据的比例不应超过%), 缺少的数据是采用组合平均法填充。e组合平均值使用两个不同的平均值计算: 天(d)a呃在失踪的那一天之前,day()=∑d=1.(-)+∑d=1.(+),()和前一天的缺失日数年,year()=Ny=1.y()()e数据集中缺少的值为通过平均计算值填充() 以及().在表中, 对两个测量站(Bole和Tamale)的日平均气温进行了描述性统计。e两个城镇的中值、平均值、最高温度和最低温度值一致,这可以归因于这两个测量站的地理位置并不遥远。e变化量(std)相对较小,但在两个测量站之间有所不同。偏斜度值为. 和. 对于Bole和Tamale而言,这两个镇的经验分布是不对称的。由于两个镇的峰度都为负,可以解释DATdata的分布比正态分布更容易出现异常值。我们提供价值观-皮尔逊质量标准的统计-t及其DAT时间序列数据的P值(见表). 从善良的-t测试和1%-信号电平cance,可以拒绝零假设(数据为正态分布)。Hurstexponent(H)大于.对于这两个城镇,DAT数据有很强的趋势。然而,Bole DATdata的趋势比Tamale的趋势更可预测。4.1. 季节性成分。

14
kedemingshi 在职认证  发表于 2022-6-10 10:37:23
一般来说,温度遵循季节规律。这些季节模式可以分解为季节趋势和线性趋势,这取决于数据采集的区域和使用温度数据的年份数。e在模型中捕获数据时间序列数据中的季节分量(). 为了将DAT时间序列数据校准到建议的模型(),DAT时间序列将取消季节化。图形 显示了Bole和Tamale的日平均气温季节化数据。从图, DAT时间序列数据具有很强的季节性。非洲的温度呈现季节性趋势;旱季温度较高;雨季温度较低。在模型中捕获季节趋势(). e模型的季节成分() 给定为sin((2/360)(-)).EDATDATA根据模型进行校准,并使用最小二乘法估计参数。尽管数据中的线性趋势很弱,但仔细观察(见图) 数据显示出增长趋势。e我们数据中的线性趋势可能是由于所用时间较长所致。此外,正如Alaton等人所观察到的[], 几十年来,该地区的DAT呈上升趋势,这是由许多因素造成的,其中包括对全球变暖的限制ect和城市化。e模型的线性组件()给定为+.4.2. 残差。图形 显示了Bolean和Tamale的去季节化日平均温度数据的平方残差图。有证据表明噪声方差在不断变化,这是季节异方差的一种指示。is表明,去季节化数据残差的波动性并不像Elias et al[].

15
kedemingshi 在职认证  发表于 2022-6-10 10:37:31
为了进一步验证这一结果,我们使用剩余统计量的个体检验来检验条件异方差。来自表, 我们可以拒绝无条件异方差的零假设,并得出如下结论:超高异方差e两个城镇的剩余系列中的ects。p值为0且为1%-信号电平对于这两个城镇,都有强有力的证据反对无条件异方差的无效假设ects。4.2.1. 温度数据残差的正态性检验。在本节中,将统计和图形方法应用于DAT残差时间序列数据,以测试残差的正态性。大多数常规文献[, , ] 假设残差是独立的、相同的、正态分布的。

16
nandehutu2022 在职认证  发表于 2022-6-10 10:37:35
然而,应注意,该残差分布的不准确选择可能会导致模型误差和 国际随机分析杂志平均温度(C) 1000 2000 3000 4000 5000 6000 7000 8000 9000 1000000时间(天)(a)Bole去季节化数据平均温度(C) 1000 2000 3000 4000 5000 6000 7000 8000 9000 1000000次(第0(b)天)塔马利去季节化DATF : 观测日的历史平均温度// 到//, 表现出季节性周期。平均温度(C) 1000 2000 3000 4000 5000 6000 7000 8000 9000 1000000时间(天)(a)Bole去季节化数据平均温度(C) 1000 2000 3000 4000 5000 6000 7000 8000 9000 1000000次(天)(b)塔马利语非季节化DATF : 从// 到//.-2.-6.-4.-8 Bole的剩余频率(a)直方图nal剩余频率-6.-4.-2.-8塔马利语残差(b)直方图nal残留量 : 直方图Bole和Tamale的nal残差。1000 2000 3000 4000 5000 6000 7000 8000 9000 100000(a)Bole squared Residuals 1000 2000 3000 4000 5000 6000 7000 8000 9000 100000(b)Tamale squared Residuals F : 平方Bole和Tamale的nal残差。国际随机分析杂志Tamale残差与标准正态的QQ图Bole残差与标准正态的QQ图-2.-3.-1.-4.理论分位数-8.-6.-4.-2分位数样本-3.-2.-1.-4.理论分位数-8.-6.-4.-2样本数量f : Bole和Tamale残差的正态分布QQ图。Tamale残差数据正态分布Bole残差数据正态分布-4.-6.-8.-2.-10Tamale残渣0.050.10.150.20.250.3密度-8.-6.-4.-2.-10Bole残留物0.050.10.150.20.250.30.350.4密度f : 典型的Bole和Tamale残差的t图。伯勒淡啤酒-8.-6.-4.-2ResidualsF : 盒状图nal残差。天气衍生品定价时的错误定价。

17
能者818 在职认证  发表于 2022-6-10 10:37:38
为了对DAT数据的残差进行建模,重要的是使用di测试残差的正态性不同的优点-t试验。桌子 显示正态分布-剩余人员统计。e的值因为Bole和Tamale很重要康塔特99%conDENSE水平意味着Boleandtamalearenotnormally分布的残差。E表中给出了Bole和Tamale残差的描述性统计数据. 从表中的赫斯特指数, Bole和Tamale DAT的剩余量具有很强的趋势,并且更具可预测性。e表中的偏度和峰度 进一步表明,残差不是正态分布的。ESE结果与正态分布的Q-Q图一致 : 统计数据Bole和Tamale的nal残差。PvalueBole. . ×10-48塔马利. . ×10-87(图) 和正常的t图(图). 图形 表明Bole和Tamale的日平均温度残差中存在异常值。此外,使用JacqueBera(JB)的-ttest和Anderson-Darling(AD)正态性测试(见表), 我们可以拒绝零假设,即残差 国际随机分析杂志 : 描述性统计Bole和Tamale的nal残差。平均中位数标准最小最大偏度峰度Hurst指数. ×10-06. . -. . -. . .塔马利. ×10-06. . -. . -. . .T : 善良的-残差t检验。(a) JacqueBeraTestBole TamaleTest统计. .P值≤0.001≤0.001(b)Anderson Darling testBole TamaleTest统计. .P值≤0.0005≤0.0005正态分布在99%浓度下验证级别。

18
何人来此 在职认证  发表于 2022-6-10 10:37:41
从测试统计数据(表) 和图形表示(图–), 有足够的证据表明,Bole和Tamale的deseasonalizedDAT残差不符合正态分布。我们可以得出结论,它不是ecientto用高斯过程对随机噪声进行建模。由于正态分布无法捕获Desasonalizeddattdata的WellTheresiduals,我们建议使用L'evy过程来建模shi的残差edregime。我们使用广义双曲(GH)分布及其子类(正态逆高斯(NIG)、双曲(HYP)和方差伽马(VG))来捕获残差数据中的倾斜和半重尾。我们测试最好的t表示使用上述命名分布的残差数据。4.3. 广义双曲线(GH)分布。我们对残差进行建模t什叶派的由广义超字母(GH)分布和与应用程序相关的子类定义。扩散系数开端4。e Barndor引入了一维广义双曲线(GH)分布-尼尔森[]其概率密度函数为dened as公司GH;五、,,,=五、,,+-(五/二)-1/4)β(x-μ)×五、-1/2--()哪里(五),,,) = (-)五/二/2.五、-1/2五、五(-), Vis the modi第三类V阶ed Besself函数,以及∈中的REach参数(五),,,,))分配hasdi埃伦特e分布形状上的ect:V∈ R确定GHdistribution子类的特征,>0控制山峰周围的陡度(较大的, 密度越陡),使用0≤||≤是TheAsymetry参数(=给定对称分布密度的偏度随着增加),是分发的位置,以及>0是缩放比例。

19
kedemingshi 在职认证  发表于 2022-6-10 10:37:45
正确选择这些参数有助于描述di分布的不同形状。假设一个随机变量遵循广义双曲分布,然后特征函数(矩母函数(MGF)或累积量函数)给出如下X()=EzX=μz--+五/二五、-+五、-,+<()GH分布的子类包括正态逆高斯(NIG)分布、双曲线(HYP)分布和方差伽马(VG)分布。扩散系数启动5。对于V=-0.5在GH分布中,我们得到了正态逆高斯分布(NIG)。NIG分布的概率密度函数(pdf)(,,,)arandom变量的是一个in单位可分分布NIG;,,,) =-1.·经验值-+-+-+-()其中0≤||≤, 0≤,和,∈RVis the modiedBessel函数。年引入了e NIG分布南希文学 巴恩多-尼尔森[]. NIG分布比正态分布有一个更大的尾部,可以各种形状。NIG分布的e MGF为NIG()=经验值+---+,+<()e NIG分布具有以下特性:() 条件是=0, →∞,和/=,NIG分布将接近正态分布(,).国际随机分析杂志() 假设~(,,,),然后∈R+和∈R、 我们有那个=+~(/,/,+,)扩散系数启动6。当V=1时,双曲分布(HYP)是GH分布的一个子类。给定一个双曲面变量,DFISGIVENASHYP;,,,) =-2.-·经验值-+-+-()哪里,∈R、 0个≤,||<和是第三类带指数的贝塞尔函数吗双曲线分布也可以捕获半重尾。

20
kedemingshi 在职认证  发表于 2022-6-10 10:37:48
双曲线分布的e MGF为HYP()=μz--+-+-,+<()双曲分布在卷积下是不闭合的。扩散系数开始7。通过限制=0和V>0,我们有方差伽马(VG)分布和PDFVG;五、,,) =-2伏Γ(V)(2))五、-1/2-五、-1/2·五、-1/2-β(x-μ),∈R()哪里∈R、 V>0,>||≥0,且Γ表示gammafunction。五(·)是modi第二类ed Bessel函数。e方差γ密度由Madanetal引入。[].eTailsofVGD分布比正态分布下降得慢。一类VG分布在卷积下闭。VG分配的MGF为VG()=μz--+2V,+<()4.4. 参数估计。估计了季节性模型和TML模型的参数。e这些参数的估计取决于1987年1月1日至2012年8月31日的Bole和Tamale DAT数据。4.4.1。将确定性季节性模型与数据拟合。确定性季节性过程,模型(), can BET转换为d()=+()+罪2.+余弦2.()到nd模型中的数值(), 转换的不确定性季节性过程(模型()) 是发送至数据。e参数使用最小二乘法估计。===+=2.棕褐色的-1.()4.4.2. TML参数估计。估计TML模型的参数并非易事。使用Dempster等人开发的期望最大化算法估计模型的参数[]. 未知参数的e向量将通过两步迭代算法进行估计:预期(e)步和最大化(M)步。离散化。尽管温度是一个连续的过程,但它的数据不是连续记录的,而是在离散的时间点记录的。因此,估计连续时间内的参数将是计算上的困难。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 02:36