在做了很多卡方检验、线性回归之后,有时候我们就会想,X与Y真的就只是线性关系吗?有没有可能存在拐点?边际作用会不会随着X的变化而发生变化,不论这中变化是减小还是反方向。最典型的就是暴露-反应曲线。类似地,如,健康人力资本对经济的增长影响是否存在拐点?颗粒物对慢性病的污染影响随着浓度的增加会不会减弱?护患比的增加真的不会增加住院患者结局的死亡风险吗?等等。经济学上常常称U型曲线或倒U型曲线,探究经济结构的变动。
对于以上类似非线性关系的探究,常见的处理方法有加入平方项或更高次项(可能存在共线性问题)、也可以用广义模型。此处我们介绍另一种方法—门槛效应模型(Panel Threshold Model)。该模型最早可见1999 Hansen 一篇文章(Hansen B E. Threshold effects in non-dynamic panels:Estimation, testing, and inference[J]. Journal of Econometrics,1999,93(2):345-368.)的详细介绍,此处不再说明。该模型的基本思路是估计出可能存在的拐点值,然后进行检验,求出对应的置信区间。Stata对应的命令在国内主要有两位学者提出,一位是在人大经济论坛上熟悉的连玉君老师,另一外是天津的王群勇老师。对应的stata命令分别为 xtthres(连), xtptm, xthreg(王)。这些命令在网上都能很容易的下载到。具体的syntax不再列出。需要说明的是这几个命令各有其特点,如xtthres操作简单,xthreg运行时间较短,而且王老师的命令已经发表在stata Journal上。更详细的资料,大家可以搜搜连玉君老师的文章和stata Journal上面的介绍。到底选取三个门槛效应模型命令的哪一个取决于个人。
下面举出小编做过一个数据为例说明一下结果:
欲研究PM10与健康指标的“暴露-反应曲线”。
首先程序会对门槛值的个数进行bootstrap,经过数据分析,发现存在两个门槛值,那么就会将影响效应分为三段。做出对应的图如下图。说明PM10对健康某个指标(此处不作公开^^)的影响虽然都是负向的,但是非线性关系。因此在讨论的时候会有更多的话去说。
门槛效应模型相对于线性模型更为精确地探究因变量和自变量的关系,这对于管理者(或者政策制定者)提供的参考尤为重要(当然,对于论文的创新性也很重要~)。如,国外有学者研究护患比存在最优点:过高的护士比例反而会造成不必要的人力资源浪费,而过少的护士会影响医疗质量。因此,通过数据计算出合适的护患比对于医疗的供需双方都有非常重要的意义。
转载地址:地址
---------------------------------2016年7月12日10:07:38