楼主: XXXTE_YU
477 3

[回归分析求助] xtlogit ,fe数据样本量大幅减少 [推广有奖]

  • 0关注
  • 0粉丝

小学生

42%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.1233
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
70 点
帖子
2
精华
0
在线时间
22 小时
注册时间
2024-2-22
最后登录
2024-6-14

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求大神解答,我被解释变量Y1为0、1虚拟变量,被解释变量Y2为连续变量,解释变量为连续变量,共有16000多条数据;霍斯曼检验都是固定效应更合适,所以用xtlogit,fe 和xtreg,fe 进行回归,回归结果是好的,但是参与回归样本量却出现较大的差距:XTLogit,fe跑出来N只有4000多条,而xtreg,fe跑出来 N显示16000多。看了其他的回答说xtlogit会drop掉那些连续年份全为1或0的企业数据。请问xtlogit,fe 和xtreg,fe跑出来的实证结果N不一致且差距较大论会有问题吗(ps1我看其他的论文和期刊Y1和Y2跑出来的N是一致的)还有一个小问题:我看到一篇毕业论文对于0、1变量的实证回归居然报告的是线性估计结果这样也可以吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:xtlogit logit tlo Log 样本量

沙发
Raymond.K 学生认证  发表于 2024-4-25 14:44:55 |只看作者 |坛友微信交流群
可能存在一定的问题,需要argue这些drop掉的企业是随机缺失的,即不存在某种因素使得某些企业在观测期间全为1或全为0;或者简单检验下4000个样本和16000+样本在某些关键变量上的分布是否存在差异。线性回归的那种是线性概率模型LPM,处理好异方差问题也是可以接受的,尤其是概率在0.5左右时近乎线性。可以看下任何一本计量书

使用道具

藤椅
秋秋看财经 在职认证  发表于 2024-4-29 08:03:51 来自手机 |只看作者 |坛友微信交流群
赞同上楼所说

使用道具

板凳
赵安豆 发表于 2024-5-21 17:30:26 |只看作者 |坛友微信交流群
在使用xtlogit,fe进行固定效应 logit 回归时,的确会发生因个体在所有观测期内虚拟变量Y1始终为0或1而被系统排除的情况。这是因为在固定效应模型中,此类数据对估计方程的参数没有贡献,因此会被剔除,以避免过度解释。这可能是造成xtlogit,fe和xtreg,fe样本量不一致的主要原因。

对于你的问题,N值不一致可能会影响结果的解释和推论,因为不同的样本可能导致不同的结论。如果其他论文中的Y1和Y2跑出来的N是一致的,那可能是因为他们的Y1变量在所有观测期内并非全为0或1,或者他们使用了不同的方法处理数据。

至于你的第二个问题,通常对于0-1虚拟变量,应该采用适当的分类回归模型,如逻辑斯谛回归(logit)或泊松回归等,而不是线性估计。线性估计可能无法捕捉到0-1变量的性质,并可能导致错误的统计推断。如果一篇毕业论文报告的是线性估计结果,这在方法上可能是不合适的,建议使用适当的非线性模型进行分析。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-16 13:48