楼主: 何人来此
1873 33

[量化金融] 帕累托指数与最高收入的有效最小距离估计 [推广有奖]

21
能者818 在职认证  发表于 2022-6-11 09:22:24
此外,该方法要求帕累托指数α的恒定性,如图1b和2b所示,这是有疑问的。5结论当只有最高收入份额数据可用时,本文建立了帕累托指数的有效最小距离估计量。这一点在研究收入不平等方面尤其重要,因为由于身份问题,通常无法获得最富有人群的个人层面数据。我们的估计是一致的和渐近正态的,并且在蒙特卡罗模拟显示的有限样本中表现优异。特别是,我们建议只使用top1而不是10%的份额来研究收入分配的尾部。Wee估计美国的帕累托指数大约为1.5,自1985年以来一直保持稳定,而法国在二战前后的帕累托指数大约为1.5和2。引理2.2的一个证明。使用(2.2a),(2.3b),变量v=1的变化- x、 我们得到u(J,F)=ZJ(x)F-1(x)dx=Z1-p1级-qc(1- x)-1/αdx=Zqpcv-ξdv=cq1-ξ- p1级-ξ1 - ξ、 即(2.4a)。为了证明(2.4b),使用对称性,(2.2b),(2.3c)和变量vi=1的变化- xi,我们得到σ(J,F)=2Z0≤x个≤x个≤1J(x)J(x)f(f-1(x))f(f-1(x))(最小{x,x}- xx)dxdx=2Z0≤x个≤x个≤1J(x)J(x)f(f-1(x))f(f-1(x))x(1- x) dxdx=2cαZp≤v≤v≤qv1+1/αv1+1/α(1- v) vdvdv=2cξZqpZvp1- vv1+ξv-ξdvdv=2cξ1- ξZqp1- vv1+ξ(v1-ξ- p1级-ξ) dv=2cξ1- ξZqp(v-2ξ- v1-2ξ- p1级-ξv-1.-ξ+p1-ξv-ξ) dv=2cξ1- ξ第一季度-2ξ- p1级-2ξ1 - 2ξ-第2季度-2ξ- p2级-2ξ2 - 2ξ+p1-ξq-ξ- p-ξξ+p1-ξq1-ξ- p1级-ξ1 - ξ=2cξ1- ξ第一季度-2ξ- p1级-2ξ1 - 2ξ+p1-ξq-ξ- p-ξξ+2p1-ξq1-ξ- p2级-2ξ- 第2季度-2ξ2 - 2ξ,其中Q1-2ξ-p1级-2ξ1-2ξ=logqpifξ=1/2。引理2.3的证明。∑kk的公式来自引理2.2。假设j<k,并设v b e为“Yj+”Yk的渐近方差。

22
能者818 在职认证  发表于 2022-6-11 09:22:27
一方面,wehavev=σj+σk+2∑jk。另一方面,注意到“Yj+”yk渐近等价于LninLemma 2.1,其中j(x)=1[1- pj+1<x≤ 1.- pj]+1[1- pk+1<x≤ 1.- 根据引理2.2的证明,v=Ijj+Ijk+Ikj+Ikk,其中Ijk=cξZpj+1pjZpk+1pkv1+ξv1+ξ(min{1- v、 1个- v}-(1-v) (1)-v) )dvdv。(A.1)很明显,我们有Ijj=σjand和Ikk=σk。根据Fubini定理,Ijk=Ikj。因此∑jk=Ijk。由于j<k,因此pj<pk,我们得到∑jk=cξZpj+1pjZpk+1pkv1+ξv1+ξ(1- v) vdvdv=cξZpj+1pjv-ξdv!Zpk+1pk(v-1.-ξ- v-ξ) dv= cξp1-ξj+1- p1级-ξj1- ξ-p-ξk+1- p-ξkξ-p1级-ξk+1- p1级-ξk1- ξ!= -cξp1-ξj+1- p1级-ξj1- ξp-ξk+1- p-ξkξ+p1-ξk+1- p1级-ξk1- ξ!,即(2.4b)。为了证明∑是正定义,注意到∑jk=Ijk=Ikjand(A.1)成立,我们有∑jk=Z[p,1]φj(v)φk(v)min{1- v、 1个- v}- (1 - v) (1)- v) vvdvdv,其中φj(v)=cξv-ξ1[pj≤ v<pj+1]。取任意向量z=(z,…,zK)∈ RK。然后在引理2.2的证明中,我们得到∑z=2Xj,kzjzkZp≤v≤v≤1φj(v)φk(v)1- vvddvv=2Xj,kzjzpzvpφj(v)φk(v)1- vvdvdv=2ZpZvpφ(v)φ(v)1- vvdvdv,其中φ(v)=PKk=1zkφk(v)。由于φ是分段连续的,我们可以取一个绝对连续的本原函数Φ=Rφ,使得Φ(p)=0。根据微积分的基本定理,我们得到∑z=2Zpφ(v)Φ(v)1- vvdv。设I为因子2的积分ig。通过pa rts积分,我们得到i=Zpφ(v)Φ(v)1- vvdv=ZpΦ′(v)Φ(v)1- vvdv=Φ(v)1- vv型p-ZpΦ(v)Φ′(v)1- vv型-Φ(v)vdv=-I+ZpΦ(v)vdv<==> z∑z=2I=ZpΦ(v)vdv≥ 0,所以∑是正半定义。因为Φ是连续的,所以当且仅当Φ≡ 0<==> z=0。因此,∑为正定义。命题3.1的证明。设Z=(Z,…,ZK)~ N(0,∑)。

23
kedemingshi 在职认证  发表于 2022-6-11 09:22:29
自“Ykp”起-→uK和√n((R)Yk- uk)d-→ Zkby(2.6),使用Sk、Rk和“Yk”的定义,我们获得√n((R)sk- rk)=√nSk+1- SkSK+1- SK公司-ukuk=√nn“Yk/PYin”Yk/PYi-ukuk=√n\'\'Yk\'\'Yk-ukuk=(R)YK√n((R)Yk- uk)-ukuk?YK√n((R)YK- uK)d-→uKZk-ukuKZK。将其表示为矩阵形式,我们得到√n(\'s)- r) d-→ 赫兹~ N(0,H∑H).因为通过引理2.2,每个ukis与c成比例,∑i的每个元素与c成比例,所以向量r和矩阵Ohm = H∑H仅依赖于α。由于∑是引理2.3的正定义,H具有全行秩,Ohm 也是积极的定义。命题3.2的证明。我们证明了相反的结果。设ξ=1/α,ξ=1/α。如果r(α)=r(α),则使用rk=uk/uKand(2.4a),尤其是Rrk-1(α)=rK-1(α) <==>p1级-ξK- p1级-ξK-1p1-ξK+1- p1级-ξK=p1-ξK- p1级-ξK-1p1-ξK+1- p1级-ξK<==>1.- a1级-ξb1-ξ- 1=1 - a1级-ξb1-ξ- 1,其中a=pK-1/pK<1,b=pK+1/pK>1。根据下面的引理A.1,左手边在ξ中是单调的∈ (0, 1). 因此ξ=ξ,因此α=α。引理A.1。设a,b>0,a,b 6=1,a 6=b。然后f(x)=ax-1倍-1在x>0时会急剧增加或减少。证据通过简单代数,我们得到f′(x)=axlog a(bx- 1) - bxlog b(ax- 1) (bx- 1) =bxlog bbx- 1.axlog abxlog b-斧头- 1倍- 1..将Cauchy中值定理应用于g(x)=ax和g(x)=bx,存在0<y<x这样的ax- 1倍- 1=克(x)- g(0)g(x)- g(0)=g′(y)g′(y)=aylog abylog b.Thereforef′(x)=bxlog bbx- 1.axlog abxlog b-aylog abylog b公司=bxlog abx- 1.ab公司x个-ab公司y.由于a,b>0,a,b 6=1,a 6=b,且0<y<x,因此对数a的符号取决于a 1、bx标志-1取决于b 1和(a/b)x的符号-(a/b)ydepe nds ona b

24
nandehutu2022 在职认证  发表于 2022-6-11 09:22:32
因此f′(x)有一个常数符号。B模拟在本附录endix中,我们通过模拟评估连续更新最小距离估计器(3.5)的有限样本特性。B、 1模拟设计我们考虑了三种数据g e ne评级过程(DGP),(i)帕累托分布,(ii)学生t分布的绝对值,以及(iii)双帕累托对数正态分布(dPlN)。对于帕累托分布,我们将帕累托函数设置为α=2,并且(在不丧失一般性的情况下)将最小大小设置为c=1。对于Student-t分布,我们将自由度设置为ν=2,以便帕累托指数为2。双帕累托对数正态分布是独立双帕累托(Reed,2001)和对数正态变量的乘积。DPLN记录了经济变量的规模分布,包括收入(Reed,2003)、城市规模(Giesen e t al.,20 10)和消费(Toda,2017)。Reed和Jorgensen(2004)表明,dPlN变量Y可以生成asY=exp(u+σX+X/α- X/β),其中X,X,X是独立的,X~ N(0,1)a和X,X~ 实验(1)。对于参数值,我们设置u=0、σ=0.5、α=2和β=1,这是Toda(2012)中记录的收入数据的典型值。仿真设计如下。对于每个DGP,我们生成大小为n=10、10、10的i.i.d.样本。我们在(3.1)中设置了前百分位数,这是Piketty和Saez(2003)中报告的数字。由于DGP 2(Student-t)和3(dPlN)的分布并非严格的帕累托分布,因此我们预计,当我们使用10%(p=0.1)的最大收入百分比时,估计会受到模型错误的影响。因此,为了评估模型误判的稳健性,我们还考虑只使用前5%组(p–p)和前1%组(p–p)。

25
能者818 在职认证  发表于 2022-6-11 09:22:35
因此,总共有3=27个规格(三个DGP、三个样本量和三个最高收入百分比选择)。对于每种规格,我们估计bα,根据命题3.6中的似然比检验,构造置信区间,并使用第3.2节中的算法实现命题3.7中的规格。数字基于M=1000个模拟。表3显示了模拟结果。表3:连续更新的最小距离估计的有限样本特性。DGP帕累托-t-dPlNTop%10%5%1%10%5%1%10%5%1%n偏差-0.02-0.03-0.04-0.13-0.07-0.06-0.05-0.03-0.040.00 0.00-0.12-0.04-0.02-0.04-0.01-0.010.00 0.00 0.00-0.00-0.11-0.04-0.01-0.04 0.00 0.00 RMSE0.08 0.13 0.24 0.15 0.15 0.25 0.09 0.13 0.240.02 0.04 0.07 0.12 0.06 0.07 0.04 0.04 0.070.01 0.01 0.02 0.11 0.04 0.03 0.04 0.01 0.02n覆盖率0.92 0.92 0.92 0.50 0.86 0.90 0.85 0.910.900.96 0.94 0.95 0.00 0.76 0.94 0.59 0.93 0.950.92 0.95 0.95 0.00 0.04 0.91 0.00 0.92 0.96n长度0.28 0.48 0.96 0.27 0.47 0.95 0.28 0.48 0.960.09 0.15 0.29 0.09 0.15 0.29 0.09 0.15 0.290.03 0.05 0.09 0.05 0.05 0.09 0.03 0.03 0.05 0.09n拒收概率0.04 0.02 0.01 0.02 0.02 0.01 0.03 0.03 0.010.02 0.01 0.01 0.29 0.02 0.01 0.04 0.01 0.010.02 0.02 0.02 1.00 0.13 0.02 0.66 0.01 0.01注:每个数据生成过程(DGP)的帕累托指数α=2|t |:学生t贡献的绝对值。dPlN:双帕累托对数正态分布。n: 样本量。偏差:MPMm=1(bαm- α) ,其中m为模拟索引,m=1000。RMSE:均方根误差由qmpmm=1(bαm)定义- α). “覆盖率”是真实值α=2 fal的模拟在95%置信区间内的分数。“长度”是模拟中置信区间的平均长度。

26
nandehutu2022 在职认证  发表于 2022-6-11 09:22:38
“拒绝概率”是指提案3.7中的规格测试拒绝的模拟分数。我们可以从表3中得出一些观察结果。首先,当模型被正确指定(帕累托)时,有限样本的性能非常好。特别是,覆盖率为c损失到标称值0.95。在这种情况下,使用更多的前百分位数(包括前10%)更有效(具有较小的偏差和RMSE),因为它提供了更多的信息。其次,当模型被指定(学生t或dPlN分布)时,包括较大的前百分位数(10%)会导致较大的偏差和不正确的覆盖率。因此,最好只使用前1%或前5%内的百分位数,以抵抗潜在的模型错误。这可以从规格测试的拒绝概率看出。第三,当样本量较大(n=10,这是管理数据的典型值)且我们使用前1%组时,有限样本属性适用于此处考虑的所有分布。由于我们的估计方法是基于渐近正态性的,人们可能会担心它在有限样本中是否是一个很好的近似值。为了解决这个问题,图e 4在M=1000模拟的基础上绘制了bα的核密度(通过减去true值α=2并除以样本标准偏差来进行归一化)。每个图显示了三个样本(n=10、10、10)的结果,我们将其作为标准正态密度。在帕累托DGP下,bα的分布非常接近标准正态分布。然而,在其他两个DGP下,当我们使用前10%的份额时,由于模型规格错误,bα的分布与真实值相差甚远。

27
可人4 在职认证  发表于 2022-6-11 09:22:41
这种偏差消失了,因为我们只包括较小的顶部百分比(例如,仅顶部0–1%),如图4中的右面板所示-10-5 0 5(归一化)0.10.20.30.4标准归一化n=10n=10n=10(a)帕累托,前10%-6-4-2 0 2 4(归一化)0.10.20.30.40.5(b)帕累托,前5%-5 0 5(归一化)0.10.20.30.40.5(c)帕累托,前1%-25-20-15-10-5 0 5 0 5(归一化)0.10.20.30.5(d)|,前10%-10-5 0 5(归一化)0.20.30.4(e)| t |,t op 5%-5 0 5(归一化)0.10.20.30.40.5(f)| t |,顶部1%-10-5 0 5(归一化)0.10.20.30.4(g)dPlN,前10%-5 0 5(归一化)0.10.20.30.40.5(h)dPlN,前5%-5 0 5(归一化)0.10.20.30.40.5(i)dPlN,前1%图4:估计的帕累托指数bα的核密度。注:每个面板显示归一化bα的核密度(减去真值ueα=2,除以样本标准偏差)。模拟设计见表3的标题。B、 2排除小的顶部百分位数由于我们的估计方法是基于渐近分布的,一个担忧是,包括非常小的顶部百分位数(如p=0.01%)可能会恶化有限样本的性质。为了解决这个问题,我们在附录B.1中重新进行了模拟,但排除了小的顶部百分位数。具体而言,我们只考虑使用p–p、p–p和p–p,其中前百分位数由(3.1)给出。表4显示了结果。与使用所有百分位数(p–p,列标记为“10%”)的表3相比,不包括最小的顶部百分比,在偏差、RMSE、覆盖率和长度方面产生类似的有限样本属性。

28
能者818 在职认证  发表于 2022-6-11 09:22:45
然而,拒绝概率接近0,因为我们排除了更多的前百分位,所以测试失去了力量。表4:连续更新的最小距离估计量的有限样本性质,不包括小型顶级股票。DGP Pareto | t | dPINTop%p–pp–pp–pp–pp–pp–pp–pn Bias-0.01-0.00 0.00-0.12-0.12-0.12-0.12-0.12-0.04-0.040.00 0.00-0.12-0.12-0.13-0.04-0.04-0.040.00 0.00 0.00-0.11-0.12-0.13-0.04-0.04-0.04-0.04n RMSE0.07 0.07 08 0.14 0.14 0.14 0.08 0.08 0.080.02 0.02 0.02 0.12 0.12 0.13 0.04 0.04 0.050.01 0.01 0.01 0.12 0.12 0.13 0.04 0.04 0.04n覆盖率0.94 0.95 0.96 0.550.58 0.57 0.90 0.92 0.910.95 0.95 0.00 0.00 0.00 0.61 0.63 0.580.92 0.92 0.92 0.00 0.00 0.00 0.00 0.00 0.00n长度0.29 0.30 0.31 0.28 0.28 0.29 0.28 0.300.09 0.09 0.09 0.10 0.09 0.09 0.090.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03n拒收概率0.01 0.01 0.00 0.02 0.02 0.00 0.01 0.000.02 0.02 0.00 0.34 0.33 0.00 0.06 0.06 0.000.02 0.02 0.00 1.00 0.00 0.00 0.670.67 0.00注:模拟设计见表3的标题。B、 3与简单估计的比较在本附录中,我们比较了帕累托经验的经典最小距离估计(CMD)与简单估计(3.2)的有限样本性能。对于简单估计,我们将(p,q)=(0.1,1)/100设置为公理中常见的值,并且我们还考虑(p,q)=(0.1,0.5)/100,(0.5,1)/100。对于CMD估计量,为了使结果具有可比性,我们使用(p,p,p,p)=(0.01,0.1,0.5,1)/100。表5显示了结果。

29
mingdashike22 在职认证  发表于 2022-6-11 09:22:48
从表中可以看出,在BIAS和RMSE的ms中,CMD e估计量一致优于(3.2)中的s imple估计量。表5(3.2)中连续更新的最小距离估计量和s imple估计量的有限样本性质。偏差RMSE100(p,q)CMD(.1,1)(.1,5)(.5,1)CMD(.1,1)(.1,5)(.5,1)n Pareto-0.04 0.19 0.24 0.09 0.24 0.44 0.53 0.290.00 0.03 0.04 0.02 0。07 0.15 0.18 0.110.00 0.00 0.00 0.00 0 .02 0.06 0.07 0.04n | t |-0.06 0.17 0.23 0.07 0.25 0.42 0.52 0.28-0.02 0.03 0.04 0.01 0.07 0.16 0.18 0.11-0.01 0.00 0.00-0.01 0.03 0.05 0.06 0.04n dP lN-0.04 0.19 0.25 0.10 0.24 0.43 0.53 0.27-0.01 0.03 0.03 0.03 0.03 0.01 0.14 0.17 0.100.00 0.00 0.01 0.00 0。02 0.06 0.07 0.05注:模拟设计见表3的标题。“CMD”是指连续更新的最小距离估计器,前0.01、0.1、0.5、1个百分点。100(p,q)表示简单估计(3.2)中使用的最高百分位数。参考:青木树平和尼雷Makoto。齐普夫定律、帕雷托定律和美国最高收入的演变。《美国经济杂志》:宏观经济学,9(3):36–712017年7月。内政部:10.1257/mac。安东尼·阿特金森和托马斯·皮克蒂,编辑。高收入:全球视野。牛津大学出版社,纽约,纽约,2010年。费利克斯·奥尔巴赫。这是一个很好的例子。彼得·曼斯(Petermans Geographische Mittelungen),59:74–76,1913年。统一资源定位地址http://www.mpi.nl/publications/escidoc-2271118.RobertL.Axtell。美国企业规模的Zipf分布。《科学》,293(5 536):18 18–1820,2001年9月。doi:10.1126/科学。Nail K.Bakirov和G\'ab或J.Sz\'ekly。高斯标度混合物的Student t检验。《数学科学杂志》,139(3):6497–6 5052006。内政部:10.1007/s10958-006-0366-5。八月A.巴勒克马和劳伦斯·德哈恩。大年龄时的剩余寿命。《概率年鉴》,2(5):792–804,1974。内政部:1 0.1214/aop/1176996548。查尔斯M。

30
kedemingshi 在职认证  发表于 2022-6-11 09:22:51
比奇和拉塞尔·戴维森。洛伦兹曲线和收入份额的无分布统计推断。《经济研究评论》,50(4):723–7351983年10月。内政部:10.2307/2297772。查尔斯·比奇和詹姆斯·里士满。incomeshares和Lorenz曲线的联合置信区间。《国际经济评论》,26(2):439-45085年6月19日。内政部:10.23 07/2526594。Nicholas H.Bingham、Charles M.Goldie和Jozef L.Teugels。《数学百科全书》第27卷《正则变分》及其应用。剑桥大学出版社,1987年。米哈尔·布热津斯基。topincome股票的渐近和bootstrap推断。《经济学快报》,120(1):2013年7月10日至13日。内政部:10.1016/j.econle t.2013.03.045。陈怡婷。使用分组数据估算和测试收入分配的统一方法。《商业与经济统计杂志》,36(3):438–4552018年7月。内政部:1 0.1080/07350015.2016.1194762。蒋金龙。关于正则b est渐近正态估计。《数理统计年鉴》,27(2):336-3511956年6月。内政部:10.1214/a oms/117772862。Duangkamon Chotikapanich、William E.Griffiths和D.S.Prasada Rao。E使用有限的数据估计和合并国民收入分配。商业与经济统计杂志,25(1):97–109,2007年1月。内政部:10.1198/0 73500106000000224。Duangkamon Chotikapanich、William E.Griffiths、D.S.Prasada Rao和Vicar Valencia。《1993年和2000年全球收入分配和不平等:将国家一级的不平等纳入贝塔分布模型》。《经济学与统计评论》,94(1):52–732012年2月。内政部:10.1162/REST a 00145。劳伦斯·德哈恩和安娜·费雷拉。极值理论:简介。斯普林格运筹学和金融工程系列。纽约州斯普林格,2006年。Daniel R.Feenberg和James M.Poterba。收入不平等与高收入纳税人的收入差距:来自纳税申报表的证据。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 17:02