普通最小二乘回归建立了在自变量X=z下因变量y的条件均值与X的关系的线性模型。而分位
数回归(QuantileRegression)则利用自变量x和因变量y的条件分位数进行建模。与普通的均值回归相比,它
能充分反映自变量X对于因变量y的分布的位置、刻度和形状的影响,有着十分广泛的应用,尤其是对于一
些非常关注尾部特征的情况。
传统的线性回归模型描述了因变量的条件分布
受到自变量X的影响过程。普通最dx--乘法是估计
回归系数的最基本的方法,它描述了自变量X对于
因变量y的均值影响。如果模型中的随机扰动项来
自均值为零而且同方差的分布,那么回归系数的最
dx--乘估计为最佳线性无偏估计(BLUE);如果近
一步随机扰动项服从正态分布,那么回归系数的最
dx--乘法或极大似然估计为最小方差无偏估计
(MⅥ甩)。但是在实际的经济生活中,这种假设常
常不被满足,饲如数据出现尖峰或厚尾的分布、存在
显著的异方差等情况,这时的最小二乘法估计将不
再具有上述优良性且稳健性非常差。最小二乘回归
假定自变量X只能影响因变量的条件分布的位置,
但不能影响其分布的刻度或形状的任何其他方面。
为了弥补普通最dx--乘法(0Ls)在回归分析中
的缺陷,Koenkel"和Pxassett于1978年提出了分位数
回归(Quantile Regression)的思想⋯。它依据因变
量的条件分位数对自变量X进行回归,这样得到了
所有分位数下的回归模型。因此分位数回归相比普
通最小二乘回归只能描述自变量X对于因变量y
局部变化的影响而言,更能精确地描述自变量X对
于因变量y的变化范围以及条件分布形状的影响。
分位数回归能够捕捉分布的尾部特征,当自变量对
不同部分的因变量的分布产生不同的影响时.例如
出现左偏或右偏的情况时。它能更加全面的刻画分
布的特征,从而得到全面的分析,而且其分位数回归
系数估计比OLS回归系数估计更稳健。
近10多年来,分位数回归在国外得到了迅猛的
发展及应用,其研究领域包括经济、医学、环境科学、
生存分析以及动植物学等方面(见本文第四部分)。
为了说明分位数回归的有用性,我们特介绍两个分
位数回归实证分析的例子。Koenker和Machado分
析了1965~1975以及1975~1985这两段时间内世
界主要国家的经济增长情况。模型选取了13个影响
经济增长的自变量,通过分位数回归得出结论:对于
起初的单位资本产出这一自变量来说,它的全部回
归分位系数基本保持不变,这就意味着对于经济发
展迅速与缓慢的国家而言,起初的单位资本产出对
于经济增长的影响基本相同;但是教育支出占GDP
的比重以及公共消费占GDP的比重这两个自变量
对于经济发展缓慢的国家影响更加的强烈[2l。
Chen使用分位数回归方法深入研究了美国8 250名
男性的BMI(身体质量指数,一种广泛用于测量偏
胖还是偏瘦的指标,BMI=体重/身高2)情况,并得
出结论:在2~20岁这一快速成长期中,BMI非常
迅速的增加;在中年期间其值保持比较稳定;60岁
以后,BMI的值开始减少⋯3。这对于如何保持一个
健康的身体提供了一种非常有效的措施,可以在各
个阶段中分别采取相应的控制体重的方法。
|