楼主: 何人来此
1873 33

[量化金融] 帕累托指数与最高收入的有效最小距离估计 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-11 09:21:53
(3.3)以下pro位置表明's是渐近正态的。提案3.1。设rk=uk/uk,其中uk=u(pk,pk+1)由(2.4a)给出。确定(K- 1) -向量r=(r,…,rK-1)和(K- 1) ×K矩阵H=IK-1.-r/uK.然后√n(\'s)- r) d-→ N(0,H∑H).方差矩阵Ohm(α) :=H∑H仅取决于α,为正定义。根据命题3.1,考虑经典最小距离(CMD)估计量(Chiang,1956;Ferguson,1958)bα=arg minα是很自然的∈A(r(α)- 秒)cW(r(α)- 其中cw是一些对称和正定义的加权矩阵,是一个紧凑的参数空间。设Gn(α)为(3.4)中的目标函数。假设CWP-→ W asn公司→ ∞, 其中,W也是正定义。出租α∈ A是真正的pareteoxponent,我们有gn(α)p-→ G(α):=(r(α)-r(α))W(r(α)- r(α))。由于W是正定义,我们有G(α)≥ 0=G(α),当且仅当r(α)=r(α)时相等。以下命题表明,参数α是由该条件确定的点。提案3.2(识别)。α6=α意味着r(α)6=r(α)。使用标准参数,从上述识别结果得出一致性和渐近正态性。定理3.3(一致性)。让A (1, ∞) 紧凑,α∈ A、 假设CWP-→ W为n→ ∞, 其中W为正定义。设bα为(3.4)中的最小距离估计量。然后bαp-→ α.证据显然,G(α)在α>1时是连续的。该陈述源自命题3.2,统一大数定律,以及Newey和McFadden(1994,定理2.1)。定理3.4(渐近正态性)。设r(α),Ohm(α) 定义见提案3.1。假设定理3.3的假设成立,α是A的内点√n(bα- α) d-→ N(0,V)为N→ ∞, 其中V=(RW R)-1R级WOhmW R(RW R)-1用于Ohm = Ohm(α) 和R=r(α)。证据

12
kedemingshi 在职认证  发表于 2022-6-11 09:21:55
直接引自定理3.3和Newey和McFadden(1994,Theorem3.2)。根据经典最小距离估计的标准结果(Chiang,1956;Ferguson,1958),我们通过选择加权矩阵(如CWP)来实现效率-→ W=Ohm-因此,最自然的估计量是以下连续更新的最小距离估计量(CUMDE)。推论3.5(有效CMD)。让一切都如定理3.4所示,用bα=ar g minα定义连续更新的最小距离估计量(CUMDE)∈A(r(α)- 秒)Ohm(α)-1(r(α)- “(3.5)其中Ohm(α) 如提案3.1所示。然后√n(bα- α) d-→ N(0,(ROhm-1R)-1) ,(3.6)其中Ohm = Ohm(α) 和R=r(α)。估计量bαCUMDEhas是所有CMD估计量中的最小渐近方差。我们可以使用(3.6)来构建α的置信区间。我们现在考虑根据备选方案H:α6=α检验零假设H:α=α。以下主张表明,我们可以实施似然率和概率测试,从而避免计算R(α)的导数。我们省略了这些证明,因为它们与标准GMM结果是一致的(Newey和McFadden,1994,第9节)。似然比检验也可以用来构造置信区间。命题3.6(似然比检验)。在零H下:α=α,we haven(Gn(α))- Gn(bα))d-→ χ(1).在备选方案H下:α6=α,我们haven(Gn(α))- Gn(bα))p-→ ∞.命题3.7(规格测试)。假设K≥ 3、如果F是具有指数α的ParetoCDF∈ A、 thennGn(bα)d-→ χ(K- 2).3.2讨论与实施在本节中,我们讨论了最高收入份额的选择和我们估算方法的实施。如第2节所述,设Y为具有累积分布函数F的正随机变量。

13
大多数88 在职认证  发表于 2022-6-11 09:21:58
请注意,我们的帕累托假设用作基础分布F的尾部近似值,它实际上可能与精确的帕累托分布存在亚本质差异。统计文献在非常有限的假设下正式证明了这种近似。具体地说,请考虑以下因素:1.边际收益和边际收益(y)=F(u+y)- F(u)1- F(u)作为给定Y的条件CDF≥ u、 还定义了广义帕累托分布(GPD、de Haan和Ferreira,2006年,第3章),由g(y;ξ,σ)=(1)给出-1+ξyσ-1/ξ, (ξ 6= 0)1 - 经验值(-y/σ),(ξ=0)(3.7),带y≥ 如果ξ,则为0≥ 0和y∈ (0, -σ/ξ)其他情况。让Y为Y的支撑点的右端点,即∞ ifξ≥ 0.n The Pickands Balkema de HaanTheorem(Balkema and de Haan,1974;Pickands,1975)指出,GPD是Fu的一个很好的近似值,即Limu→ysupy公司∈(0,y-u) |傅(y)- G(y;ξ,σ)|=0,(3.8),其中标度参数σ>0隐式取决于u。参数α=1/ξ是我们感兴趣的对象。它是唯一由下伏分布决定的,并以其尾部重量为特征。近似(3.8)成立的必要和有效条件是F位于三个极限定律之一的吸引域,这是一个阿米尔德条件,适用于几乎所有常用的分布。正α情形包括具有Pareto型尾部的分布,如Pareto、Student-t和F分布。特别是,如果F是标准的帕累托分布,如1-F(y)=y-α、 然后Fu(y)=G(y;ξ,σ)成立,ξ=1/α,σ=u/α。IfF是自由度为ν的Student-t分布,则(3.8)在u发散时渐近成立,ξ等于1/ν。参见de Haan a and Ferreira(2006年,第1章),了解概述。对于α的估计,实际确定u(和我们的最高收入百分位数p。

14
可人4 在职认证  发表于 2022-6-11 09:22:01
,pK+1)被广泛认为是一个困难的问题,即使观察到{Yi}ni=1。在我们的表格设置中,它变得更具挑战性(如果可能的话)。要了解这一点,请考虑以下示例:F是概率为0.1的somePareto分布和概率为0.9的标准正态分布的混合。这种结构意味着只有极少数的顶级股票才是真正的尾部信息。在这种情况下,选择太多的p共享s,比如说高达10%,将隐含地包括太多来自s中部样本的观察结果,这会产生很大的偏差。然而,选择较少的优先股会导致较少的观测值,因此会损害centrallimit定理的渐近高斯性。原则上,由于F未知,因此不可能有一个程序一致地确定u的最佳选择。这在精神上接近于bia在标准核函数带宽选择方面的s方差权衡。穆勒和王(20-17,定理5.1)在案例中用完整的观察结果形式化了这个结果。鉴于这一困难,我们采用附录B中的模拟研究来选择第4节中应用的顶级股票。根据推论3.5,我们可以通过数值求解极小化问题(3.5)来计算bα。然而,从Le mmas 2.2和2.3中可以清楚地看出,ξ=1/α在r(α)和Ohm(α) ,因此,在ξ=1/α上进行优化更为方便∈ (0,1)而不是α>1。因此,设r(ξ)=r(1/ξ)和Ohm(ξ) = Ohm(1/ξ) . 因此,我们可以使用以下算法估计ξ(和α)。1、鉴于最高收入份额数据,SK+1对于顶部p。pK+1%定义标准化股份(3.3)。2、ξ∈ (0,1),定义rk(ξ)=p1-ξk+1-p1级-ξkp1-ξK+1-p1级-ξKand▄r(ξ)=(▄r(ξ),rK-1(ξ)).3.

15
可人4 在职认证  发表于 2022-6-11 09:22:05
定义Ohm(ξ) = Ohm(1/ξ)使用(2.4a),(2.4b),(2.7)和命题3.1,其中我们可以设置c=1而不丧失一般性。4、确定目标函数▄G(ξ)=(▄r(ξ)- 秒)~Ohm(ξ)-1(¢r(ξ)- ,并计算出ξ上G的最小值bξ∈ (0, 1). 帕累托指数α的点估计为bα=1/bξ。如果样本量n已知,则使用推论3.5或命题3.6构建置信区间。为此,可以使用▄r′k(ξ)▄rk(ξ)=p1-ξK+1对数pK+1- p1级-ξKlog pKp1-ξK+1- p1级-ξK-p1级-ξk+1对数pk+1- p1级-ξklog pkp1-ξk+1- p1级-ξk,r′k(α)=ddαИrk(1/α)=-r′k(ξ)ξ。在附录B中,我们进行了模拟研究,发现我们的估计器具有极好的有限样本特性。4美国和法国的帕累托指数作为一个经验应用,我们估计了1917-2017年美国和1900-2014年法国收入分配的帕累托指数。ForU公司。S、 ,我们使用Piketty和Saez(20 03)更新的最高收入份额数据(包括资本收益)(详情见脚注4)。对于Fra nce,我们从世界不平等数据库中获得了最高收入份额(脚注5)。这些数据集基于纳税申报表(行政数据),漏报可能不像调查数据那样严重。我们之所以关注这两个国家,是因为我们可以获得详细的最高收入份额(前0.01%-10%)的时间序列。图1a描绘了美国前1%和前10%的收入份额(包括资本收益)。众所周知,这两个系列大致平行,并且在本世纪呈U型分布。图1b绘制了第3.2节估计的帕累托指数。“前1%”使用前0.01%、0.1%、0.5%和1%组(K=3),“前10%”还包括前5%和10%组(K=5)。为了进行比较,我们还计算了(3.2)中的“简单”估计量,使用了文献中常见的0.1%和1%的兔子。我们可以从图1b中观察到一些情况。

16
何人来此 在职认证  发表于 2022-6-11 09:22:08
首先,当使用前1%和前10%组时,帕累托指数估计值存在显著差异。根据第3.2节的讨论和附录B中的模拟结果,这表明收入分配不完全是帕累托分布,10%的结果是有偏差的。因此,我们应该关注前1%的结果。帕累托指数范围为1.34至2.29。其次,我们的最小距离估计器使用前1%和(3.2)中基于前0.1%和1%份额的“简单”估计器的行为类似。然而,根据模拟结果,最小距离估计器具有精确的样本属性。最后,图1a和1b显示了收入不平等的不同情况。虽然图1a中1%以上的收入份额自1975年左右开始大致呈线性增长,但图1b中的帕累托指数在1975年至1985年间急剧下降(意味着质量提高),但自那时起一直保持不变。这一观察结果表明,如图1a所示,自1985年以来,不平等的加剧主要是由富人(前1%)和穷人(后99%)之间的再分配所驱动的,没有证据表明富人之间的不平等加剧。1920 1940 1960 1980 2000年前1%前10%(a)收入最高的股票。1920 1940 1960 1980 2000年1.41.61.82.22.42.6顶部1%顶部10%简单0.1/1(b)帕累托指数。图1:美国的收入分配图2重复了对收入的分析。同样,当使用前1%和前10%组时,点e对帕累托指数的估计值存在显著差异,因此我们应该关注1%的结果。与美国不同,美国1960-1980年似乎是一个不寻常的低不平等时期(高帕累托指数),法国的帕累托指数相对稳定,在战前1.5左右和战后2.5左右。

17
能者818 在职认证  发表于 2022-6-11 09:22:11
第二次世界大战期间,似乎发生了政权更迭,这证实了P iketty(2003)的分析。如果数据集是横截面的,则对α进行统计推断通常需要样本量n。在我们的数据集中,只包含topincome股票,样本量未知。然而,进行统计推断可能有两种方法。一个是为样本量计算一个保守的数字,另一个是利用面板数据结构,利用Ibragimov和M¨uller(2010,2016)以及Ibrag imov等人(2015,第3.3节)提出的方法,在不知道n的情况下构建置信区间。我们感谢匿名推荐人的建议。1900年1920年1940年1960年1980年2000年前1%前10%(a)收入最高的股票。1900 1920 1940 1960 1980 2000年1.52.5顶部1%顶部10%简单0.1/1(b)帕累托指数。图2:法国的收入分配。对于第一种方法,可以合理地假设美国和Fra nc e的家庭数量至少为100万(n=10)。我们可以使用这个数字来构建第3.2节中讨论的守恒置信区间。图3显示了这些保守的95%置信区间的长度,该区间是使用Coro llary 3.5中bα的渐近正态性构建的。对于美国和法国,如果仅使用top1%范围内的收入份额(由于可能的模型规格错误,其相关性更大),则长度最多约为0.1,这与表3中的数字相似,样本大小为10。因此,置信区间在估计的相关指数的±0.05范围内。例如,从图1b、2b和3中,我们可以得出结论,从20世纪70年代末到2000年代初,美国和法国的收入帕累托指数都显著下降,尽管自1985年以来,美国的帕累托指数一直稳定在1.5左右。

18
可人4 在职认证  发表于 2022-6-11 09:22:14
回到导言中讨论的最优税率问题,该估计值与收入弹性0.3一起表明,收入最大化所得税率为1/(1+1.5×0.3)=69%。1920 1940 1960 1980 2000年0.020.040.060.10.12顶部1%顶部10%(a)美国1900 1920 1940 1960 1980 2000年0.020.040.060.080.10.12顶部1%顶部10%(b)法国。图3:帕累托指数的保守95%置信区间长度。对于第二种方法,考虑{bα,…,bαL}作为使用L个独立样本的α的L估计量,其中样本大小可能是异质的。假设估计满足渐近正态性,使得对于所有l=1,五十、 我们有√nl(bαl- α) d-→ N(0,σl)为nl→ ∞, 其中,Nl表示第l个样本的样本量。假设检验问题H:α=α与H:α6=α的usualt统计量由t给出=√L((R)α- α) /sα,其中α=LLXl=1bα,sα=L- 1LXl=1(bαl- α).如果| t |大于某个临界值,则我们拒绝零假设。如果σl=所有l的σ,则临界值用l表示的学生t分布的分位数近似-1自由度。如果σlis不是齐次的,Ibragimov和M¨uller(2010)中的定理1(由Bakirov和Sz'ekly(2006)提出)确定,上述基于Student-t分布的具有相同临界值的t检验仍然有效,但具有保守性。更准确地说,只要显著水平v小于0.08 a和L≥ 我们有Limn→∞P(| t |>F-1t,L-1(v/2)| H)≤ v、 其中F-1t,L-1(v/2)表示1- 带L的Student-t分布的v/2分位数-1自由度。因此,获得了一个渐近保守的密度区间,即“α±sα√LF公司-1t,L-1(v/2)。

19
能者818 在职认证  发表于 2022-6-11 09:22:17
(4.1)该置信区间覆盖了真实α,至少为1-v概率渐近。基于之前的结果,我们可以使用不同年份的估计值来构建α的置信区间,如果每个年份的数据集相差很远,则这些估计值几乎是独立的。特别是,我们使用C MD估计量和基于战后最高收入份额数据的每一年(3.2)的简单估计量。例如,我们为最后一位数字相同的年份构建置信区间(4.1)。表2显示了帕累托指数(4.1)的(保守)95%置信区间。由于表2中的置信区间长度约为0.5,因此使用图3中的样本量保守估计得出的置信区间较短。此外,我们的短期置信区间在很大程度上证实了关于收入帕累托指数的现有结果。研究人员应该如何在这两种推理方法之间进行选择?如果样本量n等于或至少已知大于某个阈值,例如10,我们通常建议基于(3.6)的CMD方法。由于该方法使用横截面数据,我们可以每年对α进行推断。如果n完全未知,Ibra gimov和M¨uller(2010,2016)的方法是唯一可行的替代方法。请注意,这种方法需要一个面板数据,其中我们使用c横截面数据来构建第1年的bα,Bragimov和M¨uller(2010年,第2.3节)还检查了弱依赖下t-测试的大小属性,并发现即使{bα,…,bαl}是弱依赖的,测试也相当有效。

20
能者818 在职认证  发表于 2022-6-11 09:22:21
这可能表明,t-统计方法适用于样本内观测值的(弱)依赖性,因为其应用只需要组估计量的渐近独立性和正态性,如尾部指数bαl。表2:帕累托指数的保守95%置信区间。U、 S.Fra nc eYear CMD 1%简单0.1/1 CMD 1%简单0.1/1xxxx0(1.53,2.09)(1.64,1.88)(1.83,2.11)(1.74,1.96)XXX1(1.61,2.05)(1.61,1.88)(1.80,2.09)(1.71,1.96)XXX2(1.57,2.03)(1.85,2.15)(1.77,2.00)XXX3(1.61,2.09)(1.60,1.92)(1.84,2.19)(1.75,2.04)XXX4(1.57,2.07)(1.56,1.90)(1.82,2.19)(1.75,2.03)XXX5(1.52,2.11)(1.54,1.89)(1.80,2.27)(1.76,2.07)XXX6(1.50,2.01)(1.54,1.87)(1.83,2.21)(1.79,2.01)XXX7(1.53,2.03)(1.54,1.89)(1.81,2.18)(1.78,1.95)XXX8(1.51,2.03)(1.57,1.84)(1.84,2.25)(1.75,1.97)XXX9(1.56,1.99)(1.60,1.90)(1.86,2.12)(1.77,1.94)注:“XXXd年”表示S最后一位数字为d的年份,例如,{19461956,…,2016}如果d=6。其他条目是使用(4.1)得出的帕累托指数的95%置信区间。左栏基于前1%份额的CMD估计量,右栏基于简单估计量(3.2)。有关这两个估计器的详细信息,请参见正文。然后使用这些估计值进行t检验。在我们的情况下,这两种方法基于不同的数据,因此它们的结果不可直接比较。特别是,Ibragimov和M¨uller(2010,2016)的方法可以作为稳健性检查,这会导致更长的置信区间,因为它只依赖10年的估计。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 17:02