楼主: yanmeilin
6438 17

[原创博文] 零截尾二项分布 [推广有奖]

11
jingju11 发表于 2011-8-15 12:51:58
[我上面写的程序是零截尾负二项模型 还是零膨胀负二项?
0 inflated。
NB模型对over-dispersion的解析通常都比较充分(usually much better fitting than poisson)

京剧
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
yanmeilin + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

12
baoaibaobao 发表于 2011-8-15 12:57:35
yanmeilin 发表于 2011-8-15 12:27
谢谢,
我上面写的程序是零截尾负二项模型 还是零膨胀负二项?
是零膨胀模型的countreg实现,零膨胀模型应用的前提条件是数据中有大量的零,并且该数据用poisson和负二项来拟合时效果明显不好,对于零计数的预测出入较大。此时考虑用零膨胀模型。那是用零膨胀poisson还是零膨胀负二项呢?这就需要对数据进行过离散检验,看看数据中的过离散问题是由什么原因造成的。如果在考虑了零过多引起的过离散之后,数据仍然呈现过离散,那此时就需要用零膨胀负二项,否则用零膨胀poisson就足够了!而零截尾模型,之所以称之为零截尾,就是因为在零处发生了截断,数据中是没有零计数的。可以举个例子,癫痫复发次数的影响因素,前提条件至少复发一次,也就是没有零计数。零截尾计数的模型原理可以通过计数模型条件概率来实现。
大概思想是这样的,如果你想详细了解,可以发几篇文献给你!
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
yanmeilin + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

13
baoaibaobao 发表于 2011-8-15 13:05:42
jingju11 发表于 2011-8-15 12:51
[我上面写的程序是零截尾负二项模型 还是零膨胀负二项?
0 inflated。
NB模型对over-dispersion的 ...
是的,NB模型对于非零太多引起的over-dispersion是比较合适的。
确实是,有时候拟合指标以及预测都显示的较好模型,不一定就符合事实逻辑,这样的问题我个人认为需要多方面权衡考虑,采用能够合理解释的较优模型!

14
jingju11 发表于 2011-8-15 13:12:53
如果x2可以表示为x2=3x+2,那就应该是嵌套模型,我印象中嵌套模型的定义,应该是当一个模型中某些参数为某定值时,可以转换成另一模型,称之为嵌套,大概意思是这样的。vuong检验,它的原理和计算方法都不难,sas编程可以实现
本文来自: 人大经济论坛 SAS专版 版,详细出处参考: https://bbs.pinggu.org/forum.php? ... e=1&from^^uid=1032463

Fine.
Thanks for the reply again.


JingJu

15
yanmeilin 发表于 2011-8-15 20:12:32
baoaibaobao 发表于 2011-8-15 12:57
是零膨胀模型的countreg实现,零膨胀模型应用的前提条件是数据中有大量的零,并且该数据用poisson和负二项 ...
首先非常感谢您这么详细的回答。
我正在写的论文是将这种医学方面广泛应用的负二项应用到经济学里。
因为经济学中不常用,所以我的导师不懂。
1。 如您所说,在考虑了零过多引起的过度离散之后,数据仍然是离散的情况下,应该选用零膨胀。
这就出现了我一楼帖子里的问题, zeromodel y~x4,  为什么不能zeromodel y~x3, 或者y~x2, y~x5?
因为分析的结果是有出入的,而且有的明显系统显示警告。
2. 我想试一下零截尾模型, 可是没有找到相应的程序。 您可以告诉我在SAS 里是怎么写程序的吗?
3. 看了一些资料,得知vuong检验是检验零膨胀模型的方法,可是用SAS编程怎么实现?

还有您说的文献,劳驾发到我的邮箱  yanmeilin@live.co.kr    多看些资料文献,或许有的东西自己就可以感悟出来了。
不好意思,刚学sas没多久,又赶上毕业,急着写论文。 这边的导师却不懂这方面, 只好自己苦钻研了。

16
yanmeilin 发表于 2011-8-15 20:23:55
Model                       (1)            (2)             (3)            (4)            (5)
                                              
RGDP (-3)         0.636 ***  0.650 ***   0.649 ***0.658 ***0.809 *
                         (-4.65)        (-4.40)         (-4.43)     (-4.19)    (-1.82)

REXCH (-1)        0.989***     0.990 **     0.991 ** 0.992 *    0.995
                            (-2.92)       (-2.52)        (-2.41)     (-1.93)      (-1.07)

RIMPT (-1)                              1.100 *** 1.101 *** 1.078 ** 1.097 **
                                                (2.76)        (2.74)       (1.96)    (2.43)
RTRBA (-1)                                                1.53         1.507     1.551 *
                                                                  (1.58)      (1.53)    (1.68)
RUEPT (-1)                                                                1.364
                                                                                  (1.23)         
WTOD                                                                                      3.712 ***
                                                                                                   (4.12)
ADLD                                                                               0.434 ***
                                                                                                  (-2.73)
No. of obs.                 336         336             336               336              336
Log Likelihood        -231.4        -227.7        -226.4         -225.7         -216.1

Wald x2                    10.14        7.05        6.67                3.21        0.66


这是我用负二项模型得出来的 IRR结果 (因为我不知道怎么用零膨胀或者零截尾写程序)
我的输出结果里正确与否还请各位高手多多指教, 大家共同学习

17
yanmeilin 发表于 2011-8-16 23:34:08
自己顶一下

18
johnsoncat 发表于 2013-4-30 15:49:57
楼主:

你给的程序不是做零截尾负二项分布模型(ZTNB),而是做零膨胀负二项分布模型(ZINB)。
ZINB由logistic部分(即“过多零”部分)与正常的负二项分布部分组成(包含“结构零”与所有正整数值)组成。
程序中的model语句对应负二项分布部分,规定这部分应变量为y,自变量为x1~x3;
zeromodel语句对应logistic分布部分,规定这部分应变量为y,自变量为x4;
两个部分的自变量可以相同,也可以不同,根据实际情况酌情引入。

另外,零截尾模型和零膨胀模型不是一个概念与原理。
简单而言,正常的poisson分布中包含0,如果现在把零全部删掉,即现有的分布中只有正整数,从零开始“截断”,现在的分布即是零截断poisson分布。也可以从其他值,比如1,2等等截断。
零膨胀模型的话,是将模型中的零分为“过多零”与“结构零”两个来源来建模,概率密度函数是两部分的联合分布,对数似然相应的也是联合估计。

具体的您查查SAS的操作手册就清楚了。另外推荐STATA的操作手册,我觉得这个手册在模型原理上讲得更清晰易懂,特别是对于不是数学专业的同学而言。

俺不是学数学的,以上是一家之言的个人理解。若有谬误,敬请指正,希望对您的问题有所帮助。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 12:48