楼主: 呼叫0
5001 8

[回归分析求助] 求问面板logit回归中观测大量drop的处理方法 [推广有奖]

  • 0关注
  • 0粉丝

博士生

32%

还不是VIP/贵宾

-

威望
0
论坛币
5828 个
通用积分
2.2000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
105 点
帖子
67
精华
0
在线时间
491 小时
注册时间
2016-7-28
最后登录
2025-6-15

楼主
呼叫0 发表于 2020-4-13 03:14:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
计量小白,最近在写论文
在使用logit回归面板数据,我数据里有1w多个数据,但回归中的observation只剩下6000多个
stata显示是这样:

note: multiple positive outcomes within groups encountered.
note: 1,630 groups (12,447 obs) dropped because of all positive or
      all negative outcomes.


想问下研究中一般要怎么处理这种情况呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logit 处理方法 drop Log observation logit 面板数据

沙发
席慧慧 发表于 2020-4-13 22:07:04
你描述的不是很详细。显示你分组了?猜测自变量有缺失值还是因变量只有一个值?

藤椅
呼叫0 发表于 2020-4-13 23:07:55
席慧慧 发表于 2020-4-13 22:07
你描述的不是很详细。显示你分组了?猜测自变量有缺失值还是因变量只有一个值?
我控制了企业和年份的固定效应进行logit回归 xtset id year

sum 因变量是:
amount_whe~r |     19,206    .1315214    .3379785          0          1


但回归结果中观测值只有六千
xi:xtlogt y x i.year,fe结果如下

note: _I籍贯_21 omitted because of collinearity
note: multiple positive outcomes within groups encountered.
note: 1,630 groups (12,447 obs) dropped because of all positive or
      all negative outcomes.
note: _I籍贯_11 omitted because of no within-group variance.


Conditional fixed-effects logistic regression   Number of obs     =      6,678
Group variable: firmid                          Number of groups  =        616

                                                Obs per group:
                                                              min =          2
                                                              avg =       10.8
                                                              max =         13

                                                LR chi2(49)       =     651.60
Log likelihood  = -2597.3896                    Prob > chi2       =     0.0000



请问下怎么样解决固定效应logit回归中大量观测值损失呢

板凳
席慧慧 发表于 2020-4-14 15:33:31
解释如下:你的因变量是01变量,以 firmid  分组之后,有1,630 组中因变量要么只有0,要么只有1,所以就把这些组删掉了。除非你以 firmid  为分组,每组中都有0/1两个值,才不会删除样本~

报纸
呼叫0 发表于 2020-4-16 02:41:18
席慧慧 发表于 2020-4-14 15:33
解释如下:你的因变量是01变量,以 firmid  分组之后,有1,630 组中因变量要么只有0,要么只有1,所以就把这 ...
我懂啦,谢谢您
还像问一下,这样大量样本丢失会对回归造成很严重的伤害吗~有没有什么方法处理呢

地板
席慧慧 发表于 2020-4-19 15:52:39
理论上,样本量多少是有影响的,样本是用来代表总体情况的,样本量越大越接近总体。但是实际上,运用几百个样本做回归的也不少呢,你的数据删除之后还有6000多,其实数据量已经不少啦,可以继续做的

7
stella07200 发表于 2021-9-11 10:58:30
请问大神做描述性统计时如何剔除这些被drop的变量呢~~~

8
彭鹏鹏鹏 学生认证  发表于 2024-3-10 22:44:10
席慧慧 发表于 2020-4-19 15:52
理论上,样本量多少是有影响的,样本是用来代表总体情况的,样本量越大越接近总体。但是实际上,运用几百个 ...
你好,我因变量是01,样本量有9000多个,xtlogit,fe之后只剩下882个,还能继续下去嘛?

9
ekb 发表于 2024-4-25 23:22:51
彭鹏鹏鹏 发表于 2024-3-10 22:44
你好,我因变量是01,样本量有9000多个,xtlogit,fe之后只剩下882个,还能继续下去嘛?
请问你解决了吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 09:00