楼主: mingdashike22
1015 67

[量化金融] 养老保险的多元密度模型 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-8 16:59:35
根据解释(2),PDF包含RV Zt,观察如下, asf(xt,) = f(xt|)·p[Zt=] 或f(xt,zt1,…,ztg)=f(xt | zt1,…,ztg)·p[Zt=(zt1,…,ztg)\'),由下式得出:,,…,o,对于1.o,对于1.o,对于1.,Hamilton(1989)中的制度是时间序列模型。在本研究中,它们是PDF。(2.B.1)或者更紧凑地说:,,…,oo…ooo.例如,假设金融证券的N个收益率随时间观察到,并在某个总体平均值周围对称出现,不显示序列相关性,但确实包括黑天鹅事件,其频率高于正态或对数正态PDF下相应的尾部概率(Taleb,2010)。Tukey的污染正态PDF(Huber,2002)是此类回报的直观易处理PDF,它是两个均值相等但方差不等的正态的混合体。它可以用来加厚异常PDF的尾部。方差较大的密度产生异常值,概率较小。我们可以直观地将收益划分为两个集合,其中一个集合包含nnon异常值,另一个集合包含noutliers。正常PDF可以使用MLE拟合到每个集合,例如,将混合权重设置为πi=ni/N,i=1,2。如果X是代表这些收益的RV,那么X~f(X)=πf(X)+πf(X),其中fi(X)=N(μ,σi),i=1,2,σ>σ。在将所有参数替换为其估计值后,假设75%的回报来自于N(0.08,0.10)的“普通”PDF(非离群值),25%来自于N(0.08,0.30)的“灰天鹅”PDF(离群值),其中μ=0.08是总平均值,通过(见图二)。图二:。Tukey受污染的正常PDFBy标签组件示例我们正在使用解释(2)。

12
nandehutu2022 在职认证  发表于 2022-6-8 16:59:38
请注意,正常PDF的混合物通常不是正态分布,也不是对称的(这是一个例外)。注意不要将图II中的混合PDF误认为RV Z=0.75*X+0.25*X,其中X ~ N(0.08,0.10)和X ~ N(0.08,0.30),因为Z显然是正态分布的。实际上,g组分正态混合物可以模拟任何PDF和可分解的(McLachlan&Peel,2000)。例如,两条法线的混合可以非常接近观测到的异常值,称为灰天鹅事件。黑天鹅是以前从未发生过的极端事件。Taleb(2010)不鼓励在金融/经济学中使用普通PDF,并将对数普通PDF称为“糟糕的妥协”。Fama(1965)讨论了使用混合PDF来解释股价的非正态性,Taleb(2010)也在实践中使用混合PDF在正态PDF上添加一个重尾,作为对数正态PDF的替代。本特别程序仅供说明。在EM算法出现之前,这种方法很常见(见Johnson等人,1994)。正如将要看到的,混合PDF几乎总是使用EM算法或梯度程序进行校准。(2.B.2)对数正态PDF(Titterington等,1985)。最后,由于图II中的混合PDF没有模拟黑天鹅事件,因此可能会被视为不令人满意。一种解决方案是添加一个标记为“BlackSwan”的第三组分,例如N(0.08,0.50),概率很小,例如π=0.05,然后调整π和π,以便∑π= 1.C.中心极限定理(CLT)Let Xt~f(x),t=1,2,。。。,T、 E(Xt)=μ,V(Xt)=σ.  对于大号T,∑十、~ N(Tμ,√Tσ)根据中心极限定理(Freund,1992)。换句话说,来自任何PDF的iid RVs之和f(x)近似为正态(表示为~) 对于大样本,经验法则是T≥  不幸的是,这条规则并不总是适用于混合PDF。

13
可人4 在职认证  发表于 2022-6-8 16:59:41
考虑f(x)=πf(x)+πf(x),其中π=(1-10-5)和π=10-5,并设f(x)=N(0,1)和f(x)=N(10,1)。如果X~f(X),则μ=E(X)=10和σ=五、十、 3.16E(摘自§II.B)。在距离f(x)T=30的IID样本中,我们不太可能从f(x)中得出观察结果∑十、~ N(0,√)违反CLT,确保∑十、~ N(30·10,√·3.16E)。该样本由f(x)和∑十、= 6.77所有观测值均来自f(x)。该值在CLT PDFmean的σ范围内,因此是一个有效值。重复该过程9次,应从CLT PDF中生成大小为N=10的iid样本。但并非如此,因为所有10个值均<CLT PDF平均值。因此,当从混合PDF调用RVs上的CLT时,建议谨慎。例如,设rd~f(r)为标准普尔500指数每日实际回报率的RV,d=1,2,。。。,D、 其中D=#个交易日/年。1月1日投入的B美元将增至E美元$Bo∏1.r12月31日,以实际美元计价。年度实际复利回报率为=∏1.r和ln(A)=∑自然对数1.r, 这就是~ 当rdare iid(D)为>> 30).  根据定义,RV Y=e=  那么A就是~ 对数正态分布,使得年度真实标准普尔500指数的历史集合返回对数正态分布随机样本。该假设通过Anderson-Darling检验进行了检验和否定(Rook&Kerman,2015)。一种解释是,每日回报并非独立的,这一说法得到了短期指数回报学术研究的支持(Baltussen等人,2016)。另一个原因是,日收益率的分布不完全相同,或者日收益率来源于一个混合PDF,其中D的大小不足以达到CLT近似值。D、 未来观测的密度在某些假设下,可以在观测之前导出未来值的PDF。

14
大多数88 在职认证  发表于 2022-6-8 16:59:44
让Xt~N(μ,σ)是t=1,2,…,时金融证券的复合收益,。。。,T+1(μ和σ未知)。假设XT是观察到的XT值,对于t=1,2,。。。,T、 XT+1表示未观察到的下一个值。请注意,X~这种方法被考虑用于退休计划的压力测试。全样本(N=10):6.77、11.71、3.04、-6.75、5.65、-0.49、-3.53、4.58、7.95、5.55(平均值=3.45,标准偏差=5.56)。每日(实际)复合回报率可近似为1+rd=(1+rd)/1.我, 式中,Rdi是按(终值-起始值)/起始值计算的总日回报率,I是年通货膨胀率。虽然短期(即每日)指数回报率历史上表现出正的序列相关性,但Baltussen等人(2016年)认为指数产品的普遍性可能消除了信号,甚至将其变为负值。N(μ,σ/√T) ,其中X∑十、是样本平均值和(T-1)S/σ~ , 其中S=∑十、十、是样本方差,并且是具有T-1自由度的卡方RV。已确定X和Sare独立RVs(Ross,2009)。自X起和X也是独立的,X十、~ N(0,σ1.1吨)和十、十、)/σ1.1/T~N(0,1)。因此(2.D.1)具有形式N(0,1)//T1. 它遵循T-1自由度的学生st分布(Ross,2009),表示为T:十、十、σ1.TSσ十、十、σ1.T*σS十、十、S1.T~T.因此,X~十、S1.1/TT, 或者,未来的观察将以样本平均值为中心的缩放学生TDI分布PDF。在模拟研究中,这将是评估财务计划的首选PDF。如果我们可以从正态分布进行模拟,那么从学生t-1自由度的t分布进行模拟是非常正确的。

15
大多数88 在职认证  发表于 2022-6-8 16:59:47
首先,为分子生成N(0,1)个随机值,然后生成、平方和T-1个额外的N(0,1)值来构造分母的随机值。最后,使用aT定义中的比率上述RV(Law&Kelton,2000)。未来值的PDF为 可通过区分CDF得出(见§II.A)。未来观测的CDF XT+1为F = P(XT+1≤  x) =PT十、/S1.1/T, 吉文比(Freund,1992):FT十、S1.TΓTT1.ΓT1./1.T1.,式中,Γ(·)是伽马函数。最后,未来观测的PDF XT+1 FT十、/S1.1/T 使用§II导出。A和链式规则为:ΓTT1.ΓT1.1.十、S1.1/TT1.S1.T,对于∞x个∞.未来值X的PDF, …,十、可以类似地导出。假设独立,N个未来值的多变量PDF是单变量PDF的乘积。注意,该技术只是描述了X的分布Shere不是近似值(即不涉及CLT),因此对任何样本量T都有效。正态分子和卡方分母必须是独立的RVs。如果X,X。。。,Xn公司~N(0,1),然后∑十、~ , (Ross,2009)。(2.D.1)(2.D.2)(2.D.3)当添加第二个资产时。让Xt~N(μx,σ) 和Yt~N(μy,σ) 在t=1,2,…,时,两种不相关金融证券的复合收益,。。。,T+1。兴趣在于使用这些证券对多样化投资组合的未来未观测值进行建模,例如,RT+1=αXT+1+(1-α)YT+1,其中0 α  1.

16
nandehutu2022 在职认证  发表于 2022-6-8 16:59:50
因此α(XT+1-X) + (1-α)(YT+1-Y) ~ N(0,1.1/Tασ1.ασ ), 因此:α十、十、1.αYY1.Tασ1.ασ~N0,1.与1资产一样,假设一个数量Q(σx,σy)的存在使得它的函数和(2.D.4)有一个已知的PDF,它不是(σx,σy)的函数,并且可以用(2.D.4)的分子来求解。这将为Behren’s-Fisher问题提供解决方案,这是统计学中一个著名的未解决问题(Casella&Berger,1990)。E、 最大似然(ML)估计集Xt~f(x,θ),t=1,2,。。。,T、 为连续RVs,Xt为Xt的观察值。xtis f(xt,θ)的可能性,即观察值的PDF。向量θ包含未知参数,如θ=(μ,σ)′,其中E(Xt)=μ,V(Xt)=σ。似然值不是概率,可以大于1,但是,它是一个类似的度量,因为可能性越高的值越有可能被观察到。似然函数,(·),PDF是否写为θ的函数,即。,(θ| xt)=f(xt,θ)。将其扩展到整个样本=(X,…,XT)′在X=(X,…,XT)′处计算的值为f(,θ) =f(x,…,xT,θ),可写为(θ|)  =(θ| x,…,xT),整个样本的可能性。θ的一个吸引人的估计是(θ|) 及其值,表示为, 被称为最大似然估计(MLE)。由于自然对数函数在增加,最大化(θ|) 和ln((θ|)) 都是等价的问题,后者往往更容易处理。如果RVs XT是独立的,t=1,2,。。。,T、 那么(θ|) = f(x,...,xT,θ)=∏,, andln公司((θ|))=∑自然对数,.  极大似然估计具有许多理想的统计性质,如一致性、有效性、渐近正态性和不变性(对函数变换),因此通常被认为是参数估计的金标准。

17
能者818 在职认证  发表于 2022-6-8 16:59:54
然而,这些质量取决于是否满足某些规律性条件(Hogg等人,2005),见§II。G、 因此,在统计学中寻找参数估计值进入了专门研究约束优化技术的工程学科的视野,见§II。K、 源自g组分混合物PDF的iid样品的相似性函数取决于解释,见§II。B、 让(1)(θ|) = f级(,θ) 以及(2)(θ|,,…,) =  f级(,,…,,θ) 是θ的可能性=(,θ,θ, ...,θg)分别在解释(1)和(2)下。然后,Behren’s-Fisher问题在两个方差不相等(未知)的正态总体中检验等均值。LetX,。。。,Xn公司~N(μx,σ) 和Y,。。。,Yn公司~N(μy,σy)为独立样本。在Ho下:μx=μy,十、Y/σn/σn/~ N(0,1)。AQ(σ,σ) 要使此T或任何其他完全指定的PDF未知。(2.D.4)|,···,,→自然对数|自然对数,···,自然对数,,使用(2.B.2),|,,…,,o…o,,→自然对数|,,…,zo自然对数自然对数,.目标是收集数据,并最大化(2.E.2)或(2.E.4)中关于,获取MLE.  不幸的是,(2.E.4)中解释(2)的对数可能性无法直接最大化,因为缺少成分指标RVs Zt=(zt1,zt2,…,ztg)\'(即,不可见)。可以直接最大化(2.E.2)中解释(1)的对数似然,但由于各种原因,该函数不令人满意。例如,它可以有多个局部极大值,因此找到固定点并不能保证极大似然估计具有所需的性质。

18
能者818 在职认证  发表于 2022-6-8 16:59:57
对于普通组件,它也是无界的,因此可以赋予任何值, 无论多大,我们总能找到 这样ln((1)(θ|)) >  , 见附录A。当最大化正常组分的混合对数可能性时,我们将限制以下参数空间: 到一个区域((1)(θ|)) 是有限的,搜索所有局部极大值,声明作为argmax。为了限制g组分混合物PDF的参数空间,让σ为成分i的方差,i=1,。。。,g、 方差比约束为max(σ)/最小值(σ < C、 其中C是给定常数(McLachlan&Peel,2000)。对于C,一个好的选择将消除虚假的最大化器,这些最大化器是最佳值,缺乏有意义的解释,并且当一个组件适合一小部分观测值时可能会出现。F、 期望最大化(EM)算法一些研究人员在缺失数据的研究中使用了两步过程来获得最大似然估计。这一过程被观察到具有许多有趣的性质,并通过Dempster等人(1977)的证明和分析正式化,成为有史以来最有影响力的统计论文之一。该过程称为期望最大化(EM)算法,生成的最大似然估计如下:Let(Xt,Yt)~f(xt,yt,θ),假设观察到Xtis为Xtis,但缺少Ytis,对于t=1,。。。,T、 当(Xt,Yt)是iid超时时=(X,…,XT)′和=(Y,…,YT)′是f(,y、 θ)=∏,,.根据θ,当Ytis连续时,可通过对f(xt,yt,θ)的ytout进行积分,或当Ytis离散时,可通过对其求和,获得xtm的边际功率密度,见§II。A、 即f(xt,θ)=,,或f(xt,θ)=∑,,对于t=1,。。。,T、 然后,EM算法不需要iid观测,也可以用于估计HMM模型中的参数(参见§II.B)。(2.E.1)(2.E.2)(2.E.3)(2.E.4)f(,θ) =∏,.

19
大多数88 在职认证  发表于 2022-6-8 17:00:00
这导致θ有两个似然函数,一个包含缺失数据,另一个不包含缺失数据,即:。,(θ|,y) =f(,y、 θ)和(θ|) = f级(,θ).  EM算法计算, θ的最大似然估计为:开始:初始化 至起始值.E-Step:计算EY自然对数|,.  使用只有在实现预期时,才执行Y.M步骤:最大化自然对数|,关于.  使用转到E-Step=在期望中。结束:终止时间(|) 停止增加(使用%-更改低于某个阈值)。E步替换缺失的yt,t=1,。。。,T、 由于采用期望值和M-STEP,因此只有 未知的的价值(θ|) 迭代时不会减少,并将在最接近的起始值的局部最大值处结束, 鉴于(θ|) 在该区域内有界。如果(θ|) 有多个局部最大值我们使用多种启动 价值观和价值观作为argmax。该值将显示§II中所述的理想质量。E(McLachlan&Peel,2000年)。EM算法可用于查找各种模型的最大似然估计。诀窍是重新制定格式,使一些RVs出现缺失。混合PDF的应用非常简单。根据解释(2),组件指示器RVs Zt=(zt1,…,ztg)′缺失(见§II.B,§II.E)。(2.B.2)中给出了xt和Zt的多元PDF,以及相应的xt的边缘f(xt,θ)=∑,,…,∑oo…oo,···,, 这是口译(1)中使用的PDF,请参见(2.E.1)。(Ztare离散型。)包含缺失数据RVs的g组分混合物PDF中iid样本(x,…,xT)的似然函数为|,,…,根据(2.E.3),相应的无缺失数据的可能性为|来自(2.E.1)。EM算法E-Step使用EZ自然对数|,,…,取代了按其预期值。

20
mingdashike22 在职认证  发表于 2022-6-8 17:00:03
请注意|,,…,是线性的=(zt1,…,ztg)\'(见2.E.4),因此:E自然对数|,,…,Ezo自然对数自然对数,,式中,E(zti)=E(zti|,), i、 例如,使用所有可用的非缺失数据以及当前设置计算=(,θ,  ...,  θg)。由于ztiis是一个离散RV,当Xt源自分量i时等于1,否则为0,E(zti|,) = 1·P[zti=1|,] + 0·P[zti=0|,] = P[zti=1|,], 即:Ez|,P1|,1.,,,|1.oP1.,,,,对于t=1,。。。,T和i=1,。。。,g、 何时 如果给定,则该值完全已知,并替换(2.F.1)中的E(zti)。结果函数 未知在M-Step中优化。的初始值 可以使用模拟随机设置(McLachlan&Peel,2000)和(1)(θ|) 可能有许多局部最优解,策略是将EM算法应用于各种启动值并选择作为argmax。(2.F.1)(2.F.2)G.正则性条件统计测试、模型和定理是建立在一组假设基础上的,在统计推断中,这些假设被称为正则性条件。Hogg等人(2005年)附录A描述了9个这样的条件,通常情况下,给定的结果只需要满足一个子集。1stregularitycondition适用于PDF并处理唯一性,即PDF f(·),如果θ  那么f(x,θ) f(x,).  这一条件显然适用于N(μ,σ)PDF,因为改变均值或方差会改变分布。然而,考虑混合物PDF f(x,θ)=πf(x)+πf(x),其中fi(x)~ N(μi,σi),i=1,2。未知参数的向量为θ=(π,μ,σ,π,μ,σ)′。定义=(π,μ,σ,π,μ,σ)′,注意θ  但f(x,θ)=f(x,) 违反规则性条件#1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 17:39