楼主: wuxian1988
46642 26

[面板数据求助] 请问回归分析时为什么样本量会减少?(含缺失值的样本已经drop掉)) [推广有奖]

21
wondering999 发表于 2021-5-8 19:10:15
我的样本也是一回归就少了好几千个,本来都没多少个样本,这个是怎么处理的呀?

22
ysv9313236 发表于 2021-9-3 11:15:09
恋上香草味 发表于 2016-7-17 17:50
我和你遇到的情况一模一样,我是两个指标衡量被解释变量,一个用logit模型,一个用reg,结果两种情况下, ...
您好,请问您解决了吗?使用reg分组就样本正好,使用logit就会减少,这是什么原因

23
猫耳朵886 发表于 2022-1-27 17:13:31
ysv9313236 发表于 2021-9-3 11:15
您好,请问您解决了吗?使用reg分组就样本正好,使用logit就会减少,这是什么原因
请问您解决这个问题了嘛,我也遇到了,明明sum的时候变量个数很多,xtlogit之后几乎减少了一半

24
limy255 学生认证  发表于 2023-3-7 16:05:27
wangzhu8711 发表于 2021-2-26 21:35
是否是用了地区或者 产业的固定效应 如果用了 会减少的
你好 想问问为什么加入地区固定效应 样本量会减少啊  遇到了这个问题不知道怎么解释

25
川农张波波 发表于 2024-2-22 17:18:09
921125 发表于 2016-6-18 11:47
我也遇到这个问题了。样本数量是160个,但是一回归显示只有125个,我的数据都是完整的啊,没有缺失值。请 ...
同问

26
高兴的到处都是 发表于 2024-6-24 18:19:42
在进行聚类时,有些组会只有一个观测值,此时回归中会将其剔除,样本量会减少。
解决办法:
bysort id: egen count_id = total(!missing(id))
drop if count_id == 1

27
赵安豆 发表于 2024-12-24 12:48:57
在进行回归分析时,即使您已经预处理了数据并删除了含有缺失值的观测(即进行了drop操作),样本量仍然可能会减少。这通常是因为在多变量模型中,不同的变量之间可能存在不同模式的缺失性。

比如,在您的3000个样本中,某个或某些变量虽然没有缺失值被您提前过滤掉了,但在其它用于回归分析的变量中可能仍有未被发现的缺失值,即有些观测在这些变量上没有数据。当Stata执行logit回归(逻辑斯谛回归)或者reg回归(线性回归)时,它会默认使用完全案例分析(Complete Case Analysis),也就是只保留那些所有涉及变量都无缺失值的观测进行模型估计。

因此,即使您在某个步骤中已经drop了一部分含有缺失值的数据,但如果后续用到的新变量或更多变量中还有未处理的缺失数据,回归时Stata仍会进一步排除这些包含任何变量缺失值的观测,从而导致最终参与回归分析的有效样本量减少。

为了确认这一点,您可以检查所有用于模型构建的变量是否有缺失值,并确保在进行回归之前对所有涉及的变量执行相同的预处理(如删除或填充缺失值)步骤。这样可以避免因某些未注意到的变量中的缺失数据而导致有效样本数量意外减少的情况。
  
如果您希望保留更多观测以提高模型估计的稳定性和可靠性,可以考虑使用多重填补法(Multiple Imputation, MI)等更高级的方法来处理缺失数据问题,在Stata中这通常可以通过`mi impute`命令实现。这种方法会在多个假设下为缺失值生成可能的数值,然后分别基于每组填充数据进行模型估计,并最终合并结果以提供更加综合和准确的推断。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-29 14:22