楼主: rocn0190
4862 6

[其他] 请问logit/probit的问题 [推广有奖]

  • 1关注
  • 0粉丝

教授

56%

还不是VIP/贵宾

-

威望
0
论坛币
864 个
通用积分
0.0046
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
267574 点
帖子
81
精华
0
在线时间
2767 小时
注册时间
2011-10-7
最后登录
2023-3-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我的资料是用每年的家户收支调查,
手上蒐集了连续10年,
由于每年调查的家户数目都不同(ex:第一年10000笔、第二年11000笔....第十年11500笔)
而每年抽到的家户也不同,
所以这是属于cross sectional data而不能用panel data的方式处理。

我想要把十年的资料合併用logit/probit方法探讨家户落入贫穷的决定因素,
现在的方法是十年资料合併后(有十万多笔)直接跑一次logit/probit的回归,
解释变数除了放入的应变数外还有放入属于各年的dummy,
也得到了结果。

不过请问这样的作法是适当的吗?
适当的话其中要注意什麽问题?
还是这样的作法根本就是错的

期待各位的回覆,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Probit logit bit Log Rob cross 资料

沙发
602dxz 发表于 2012-2-11 14:06:04 |只看作者 |坛友微信交流群
楼主的自变量与因变量分别是什么呀?logit与probit模型是离散选择模型,所以因变量要么是1要么是0。不过看到楼主将年份都做成一个虚拟变量(哑变量),就有一个注意点了。那就是这个哑变量是变截距变量还是即变截距又变系数(不但要研究这个哑变量是怎么影响方程截距项,还要研究是否影响方程自变量的系数,大部分时候对系数的影响远远重要于对截距的影响)。楼主有十年的数据,通过引入哑变量一次性建模太复杂。而且还是作为横截面数据来处理,所以建议年一年建一次模型。然后观察每年的变量系数与截距的变化比较直观与简单。PS:其实最理想的方法是进行面板建模。每年数据样本对象不同,我个人感觉是没有关系的,因为只要你每年的样本选择是随机的,一般假设是每年的样本都可以反映整体。所以这十年数据是一个面板数据,但是可能需要将目标聚类一下,不是一个自然人而是一个地区或是一类人,然后用这一类人的平均值来作为面板中的数据单元。
以上纯属个人建议!

使用道具

藤椅
h3327156 发表于 2012-2-11 14:13:08 |只看作者 |坛友微信交流群
我觉得作法上本质上应该没什么错。
深信这资料您都收集十年,应当很了解。

但您应该对资料的调查做更多的说明,
虽然您已经说出了部份。

譬如,各年度里,家户是不是同一批家户?
【这算是资料建立提供者的问题,如果无法做,使用资料的研究者应当提出不可行的说明】
也许有的家户在某些年度都被调查到,有的则没有,
而且家户的进入与退出时间点不一样吧?

另外,个年度调查里,变量的不同应当值得注意,
我相信,随时代变迁与各种考量,各年度的变量应当会有差异,
研究者在pooling时,为了方便精简,也许会锁定一些比较重要的笔量,
虽然这项效果,也许会反应在各年的dummy里。
但小心遇对龟毛审稿人,如果有些变量它很坚持某些变量,
比较保险的作法,也许您可以把这些变量与时间进行交叉项,算模型变化。
如果模型变化后,依然得到相同的结果,那么您的结果算是很稳健。

另外,一个私人的建议,建议您投国外期刊,特别是比较不懂您资料的国外期刊,
因为计量方法国外学者比较不挑,但国内学者会要求比较新又难的计量方法使用。
国外学者也许会觉得您这样大量资料的使用,本身就是一种贡献,
计量方法没啥大问题的话,他们也就七七八八的认可了!

国内的话,嗯! 资料部份,可能他们都觉得您没他们懂,而且,计量方法,他们也觉得他们都是大师吧!

总之,祝福您!
我也只能提供这样的浅见! 希望其他人也能给些意见吧! 也帮助您的研究。




使用道具

板凳
offandon 发表于 2012-2-11 18:28:13 |只看作者 |坛友微信交流群
学习下,谢谢分享。。。。

使用道具

报纸
rocn0190 发表于 2012-2-11 20:18:26 |只看作者 |坛友微信交流群
602dxz 发表于 2012-2-11 14:06
楼主的自变量与因变量分别是什么呀?logit与probit模型是离散选择模型,所以因变量要么是1要么是0。不过看到 ...
"PS:其实最理想的方法是进行面板建模。每年数据样本对象不同,我个人感觉是没有关系的,因为只要你每年的样本选择是随机的,一般假设是每年的样本都可以反映整体。所以这十年数据是一个面板数据,但是可能需要将目标聚类一下,不是一个自然人而是一个地区或是一类人,然后用这一类人的平均值来作为面板中的数据单元。"

我之前看过一种称作pseudo panel data
是否就是您所说的呢?
是的话我之前有考虑过,不过後来并不打算用此方法!

非常谢谢您的建议噢!

使用道具

地板
rocn0190 发表于 2012-2-11 20:36:15 |只看作者 |坛友微信交流群
h3327156 发表于 2012-2-11 14:13
我觉得作法上本质上应该没什么错。
深信这资料您都收集十年,应当很了解。
想继续请教:
1.您说"应该对资料的调查做更多的说明->譬如,各年度里,家户是不是同一批家户?"
这些家户资料是每一年随机抽的,
我想每年要抽到相同的家户几乎不可能!
所以认为每年所抽到的家户都不同,
而家户进出的时间点因此也不会一样。

2.目前仅仅还是在尝试的阶段,
所以还没加入变量和年度的交叉项(就担心一开始作法是全错的!),
不过之前有考虑到此问题!
之後也会尝试!

谢谢h大您的回覆,
让我有了继续下去的信心!
也希望还有其他高手能够提供相关的意见
我自己也还在学习当中
非常感谢

使用道具

7
602dxz 发表于 2012-2-11 21:03:54 |只看作者 |坛友微信交流群
“我之前看过一种称作pseudo panel data
是否就是您所说的呢?
是的话我之前有考虑过,不过後来并不打算用此方法!”

对的,我就是建议从原始数据中按照一定分类逻辑构造伪面板数据然后进行面板建模。不过楼主已经研究过此方法,应该有您自己的道理。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 19:18