楼主: smile_nana
13785 28

[回归分析求助] 内生变量是取三个值的非连续变量怎么处理? [推广有奖]

  • 1关注
  • 5粉丝

教授

33%

还不是VIP/贵宾

-

威望
0
论坛币
5626 个
通用积分
38.5848
学术水平
13 点
热心指数
23 点
信用等级
7 点
经验
43904 点
帖子
1069
精华
0
在线时间
1209 小时
注册时间
2007-4-9
最后登录
2024-4-21

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
y=ax1+bx2+cx3
其中x2取1、2、3、为内生变量
用什么命令能够做这个问题?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:连续变量 怎么处理 内生变量 连续

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
andybee + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

沙发
h3327156 发表于 2012-10-29 14:50:14 |只看作者 |坛友微信交流群
建议,只是建议。这样的内生,显地相当复杂。

    1. 如果您的x2是有序非连续,那可能好办些。
        指令ssm,应当是您参考的。
        参见
        The Stata Journal (2006)  6, Number 3, pp. 285–308

   2.如果您的x2是是无序非连续,相当不好办。
     您可以使用工具变数的方法来处理,这时您可以考虑指令cmp。
     但我必须说明,您的案例该指令并未举例说明,我个人也没试过这样的,但我觉得应当可以试试看。
     对该指令有兴趣的话,参见
     The Stata Journal (2011)  11, Number 2, pp. 159–206

Good luck
      

使用道具

藤椅
smile_nana 发表于 2012-10-30 17:19:11 |只看作者 |坛友微信交流群
是有序非连续的 谢谢

使用道具

板凳
johnson90a 发表于 2013-6-21 17:21:40 |只看作者 |坛友微信交流群
h3327156 发表于 2012-10-29 14:50
建议,只是建议。这样的内生,显地相当复杂。

    1. 如果您的x2是有序非连续,那可能好办些。
老师您好。下午看了一下午您的帖子,对probit模型工具变量的命令还是不明白。我的模型因变量是0、1变量,内生自变量也是离散变量(有序,),找的工具变量也是离散的,这种情况,不知道ssm命令怎么写(马上就要交作业了,之前用ivprobit做的,看了您的回复才知道有问题),看不懂CMP中的说明。。。谢谢!在线等

使用道具

报纸
h3327156 发表于 2013-6-21 18:56:59 |只看作者 |坛友微信交流群
johnson90a 发表于 2013-6-21 17:21
老师您好。下午看了一下午您的帖子,对probit模型工具变量的命令还是不明白。我的模型因变量是0、1变量 ...
1. 当时我可能有点头昏,当初给的建议在第一点是有问题的。ssm是不对的。

2.  您的例子,内生自变量也是有序离散? 其实您用 ivprobit 也不是说不行啦! 只是在reduced form那条方程, 您把内生自变量当作一般连续变量执行reg罢了

3.  我个人觉得您的ivprobit那边不要放弃, 只是做为对照用, 严谨一点还是使用cmp吧! 不过这边有个问题就是,您的工具变量也是离散,是像 1 2 3 吗? 如果是,我不知道您在 当时在ivprobit那边是怎样处理这工具变数的,估计也是当作一般连续处理吧? 如果真是这样,那么请您在cmp这边,也是这样做吧!

这边提供一个演练参考
cmp setup
webuse laborsup
cmp (fem_work = fem_educ other_inc kids) (kids = male_educ), ind($cmp_probit $cmp_oprobit) tech(dfp) nolr

其中fem_work是即母亲有无工作0,1变量 kids是小孩数, male_educ是父亲教育程度
估出来的结果挺有趣的。
父亲教育高,相对生小孩的可能性越少,只生菁英阿!
母亲教育高,其找到工作的可能高,母亲其它收入高【炒股票炒地好?】其找到工作可能低【根本不须工作】,母亲的小孩越多越有可能工作【要养家活口阿】
rho的显著也反应著内生的可能…

4. 另外还有一种作法,也许就是把内生自变量拆解成多个dummy variable,不过,然后行成多条的probit方程,不过这种作法会让估计变地更耗时,多条probit不是开玩笑的,您试过mvprobit 就知道…

使用道具

地板
johnson90a 发表于 2013-6-21 19:18:01 |只看作者 |坛友微信交流群
h3327156 发表于 2013-6-21 18:56
1. 当时我可能有点头昏,当初给的建议在第一点是有问题的。ssm是不对的。

2.  您的例子,内生自变量也 ...
是,之前做过ologit,一条条拆开差点没搞疯掉。。。

我的工具变量也是有序离散变量,反正我当时全用ivprobit y (x1=z) x2 x3……这条命令做的。不过cmp到底是什么方法呢,之前从没接触过(没在书上看到过呢),与ivprobit方法的原理区别在哪里,也就说为什么x1是离散的,用cmp更好?他与probit工具变量的优劣如何判断呢?更菜鸟的一个问题,您能不能把这个命令解释下呢,就是这些变量对应的在命令中怎么放呢(y x1 x2 x3……z),在stat中就直接写这三行吗?

菜鸟问题太多,先谢过老师哈!


使用道具

7
h3327156 发表于 2013-6-21 20:43:51 |只看作者 |坛友微信交流群
johnson90a 发表于 2013-6-21 19:18
是,之前做过ologit,一条条拆开差点没搞疯掉。。。

我的工具变量也是有序离散变量,反正我当时全用i ...
1. cmp 其实就是一种混合估计式(过程),并不能说cmp就更好,只是如果多条方程在没有现成的指令下,cmp的好就出来了,像 ivpborit 来说, 适用在 y是dummy x1是连续,相同的东西 cmp 也可以做,而且两者估出来应当八九不离十,但是如果您用ivprobit 在资料类型不符的地方,那您觉得ivprobit会对吗?

2. 我不懂您所谓的probit工具变量优劣如何判断是什么,如果您是指判定工具变量是否适当,目前一般都是在单条方程下执行,换句话说,您的状况就是在probit/oprobit下自己执行,至于cmp有无事后的指令针对工具变量判定,应当是没有。

3. 有关一些原理与相关对应命令,真的建议您调Roodman那篇paper好好看,
The Stata Journal (2011)  11, Number 2, pp. 159–206
您不用怀疑或担心Roodman的Stata功力,他在Stata方面很出色的。

4. 如果照您的符号 我猜啦,应当是 【是的,在Stata就写这三行,第一行最重要,很多人都忘了写】
cmp setup
中间记得输入您的资料
cmp (y=x1 x2 x3) (x1=x2 x3 z), ind($cmp_probit $cmp_oprobit) tech(dfp) nolr

【值得注意的是x2 x3到底要不要放在x1方程那边,我个人是觉得要,但您可以根据事实情况选择,
如果x2 x3变量您觉得不会影响到x1,原则上可以不用摆】

祝 顺心 自在






使用道具

8
johnson90a 发表于 2013-6-21 21:04:57 |只看作者 |坛友微信交流群
h3327156 发表于 2013-6-21 20:43
1. cmp 其实就是一种混合估计式(过程),并不能说cmp就更好,只是如果多条方程在没有现成的指令下,cmp的好 ...
谢谢您不厌其烦地写了那么多,受益匪浅!

先把作业交了,再好好研究下那篇paper,哈哈。    那个第二个问题我打错了,我想请教的是 怎么在论文中说明cmp方法可能更适合内生解释变量(这里就是X1,其余都是控制变量)和工具变量(Z)是离散类型的估计,比如对cmp做一个简单的说明(但我找不到相关的简单点的中文材料)?

还有,老师 那个三行中的中间的一行是不是就是要调用的dat文件啊?文件名就可以吗?再次感谢!

ps:再请教老师一个问题,就是 ivprobit是不是就是probit模型的两阶段回归,但不又不是2SLS(平时的计量书里从没看到过离散数据模型的iv估计),这个到底是什么估计法呢?

使用道具

9
h3327156 发表于 2013-6-21 23:22:09 |只看作者 |坛友微信交流群
johnson90a 发表于 2013-6-21 21:04
谢谢您不厌其烦地写了那么多,受益匪浅!

先把作业交了,再好好研究下那篇paper,哈哈。    那个第二 ...
1. 中文材料目前可能没有。我觉得就理论上来说,您很难说cmp方法可能更适合…,理论上,一条probit加上一条order probit,我相信概似函数都有人导出来,理论上就可以估出来,问题是必须自己写程式去估,也许有高人就自己写,但他们不是用方便的指令cmp,我想,您只要列出方程,用 FIML estimator 即可,至于cmp您可以在注中提一下。另外,注意,即使是cmp,没见过z是离散类型变量,若z是dummy还好说,若不是,是有序离散,那么z是被当作连续。

2. 是的,反正不管用什么啦! 中间那一行是,您想办法把资料导入就对了!

3. ivprobit 有两种估法,一种是two step,一种是mle。 对的,前者听起来很像2SLS,但不是真的2SLS,所以只敢称两阶段,实际上文献要追到 Rivers and Vuong (1988), 在第一阶段是使用LS, 但第二阶段却又用到概似法【我不太敢确定,应当是这样,因为太多年前读的paper,不过我确定它有用到第一阶段的residual】。后者,与cmp用的可以说一样。

使用道具

10
johnson90a 发表于 2013-6-22 09:09:44 |只看作者 |坛友微信交流群
h3327156 发表于 2013-6-21 23:22
1. 中文材料目前可能没有。我觉得就理论上来说,您很难说cmp方法可能更适合…,理论上,一条probit加上一 ...
谢谢老师,从您这儿真学到很多,有空了就把那些文献都找出来看看!

现在cmp结果跑出来了,对cmp方法大致有了一点感性的认识,貌似也是一种两阶段的估计吧?


不过这个报告结果解读还是想请教老师:
第一阶段就是不含工具变量z的普通probit回归,这个没有问题;第二阶段定序probit回归因变量是 _cmp_y2(是不是类似残差什么的),然后加入了工具变量z;第三阶段Mixed-process regression就完全看不明白了,一个表分成了两节,上半截好像因变量是y,自变量中没加入z,下半截是因变量是内生变量X1,自变量中加入了z。

那么在论文中报告的时候是不是把第三张表格写上去就行了?那应该怎么去解释这些系数的含义呢?谢谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 18:18