人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › xtlogit ,fe数据样本量大幅减少

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: XXXTE_YU

477 3

[回归分析求助] xtlogit ,fe数据样本量大幅减少 [推广有奖]

0关注
0粉丝

小学生

42%

还不是VIP/贵宾

威望: 0 级
论坛币: 0 个
通用积分: 0.1233
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 70 点
帖子: 2
精华: 0
在线时间: 22 小时
注册时间: 2024-2-22
最后登录: 2024-6-14

楼主

XXXTE_YU 发表于 2024-4-25 14:23:09 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

求大神解答，我被解释变量Y1为0、1虚拟变量，被解释变量Y2为连续变量，解释变量为连续变量，共有16000多条数据；霍斯曼检验都是固定效应更合适，所以用xtlogit,fe 和xtreg,fe 进行回归，回归结果是好的，但是参与回归样本量却出现较大的差距：XTLogit,fe跑出来N只有4000多条，而xtreg,fe跑出来 N显示16000多。看了其他的回答说xtlogit会drop掉那些连续年份全为1或0的企业数据。请问xtlogit,fe 和xtreg,fe跑出来的实证结果N不一致且差距较大论会有问题吗（ps1我看其他的论文和期刊Y1和Y2跑出来的N是一致的）还有一个小问题：我看到一篇毕业论文对于0、1变量的实证回归居然报告的是线性估计结果这样也可以吗

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：xtlogit logit tlo Log 样本量

相关帖子

使用道具举报

沙发

Raymond.K

发表于 2024-4-25 14:44:55 |只看作者 |坛友微信交流群

可能存在一定的问题，需要argue这些drop掉的企业是随机缺失的，即不存在某种因素使得某些企业在观测期间全为1或全为0；或者简单检验下4000个样本和16000+样本在某些关键变量上的分布是否存在差异。线性回归的那种是线性概率模型LPM，处理好异方差问题也是可以接受的，尤其是概率在0.5左右时近乎线性。可以看下任何一本计量书

使用道具举报

藤椅

秋秋看财经

发表于 2024-4-29 08:03:51 来自手机 |只看作者 |坛友微信交流群

赞同上楼所说

使用道具举报

板凳

赵安豆 发表于 2024-5-21 17:30:26 |只看作者 |坛友微信交流群

在使用xtlogit,fe进行固定效应 logit 回归时，的确会发生因个体在所有观测期内虚拟变量Y1始终为0或1而被系统排除的情况。这是因为在固定效应模型中，此类数据对估计方程的参数没有贡献，因此会被剔除，以避免过度解释。这可能是造成xtlogit,fe和xtreg,fe样本量不一致的主要原因。

对于你的问题，N值不一致可能会影响结果的解释和推论，因为不同的样本可能导致不同的结论。如果其他论文中的Y1和Y2跑出来的N是一致的，那可能是因为他们的Y1变量在所有观测期内并非全为0或1，或者他们使用了不同的方法处理数据。

至于你的第二个问题，通常对于0-1虚拟变量，应该采用适当的分类回归模型，如逻辑斯谛回归（logit）或泊松回归等，而不是线性估计。线性估计可能无法捕捉到0-1变量的性质，并可能导致错误的统计推断。如果一篇毕业论文报告的是线性估计结果，这在方法上可能是不合适的，建议使用适当的非线性模型进行分析。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用