楼主: Zhang_1998
2236 6

[统计软件] 分组回归两组的样本量加和不等于基准回归样本量,检查过分组回归变量无缺失值 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

34%

还不是VIP/贵宾

-

威望
0
论坛币
100 个
通用积分
6.5905
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
455 点
帖子
47
精华
0
在线时间
242 小时
注册时间
2022-3-3
最后登录
2024-6-14

楼主
Zhang_1998 发表于 2023-2-19 11:14:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,分组回归两组的样本量加和不等于基准回归样本量,检查过分组回归变量无缺失值,请问有大佬知道是怎么回事吗?遇到这种情况应该怎么处理呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分组回归 样本量 缺失值 怎么处理

沙发
7945_1573892162 发表于 2023-2-28 10:21:51
会不会是分组回归时drop掉了一些singleton observations导致两组观测值相加不等于基准回归样本量?你用的什么命令?模型设定是什么呢?

藤椅
长似初相识 学生认证  发表于 2023-3-1 13:50:10
最好说明一下数据,分组方式或者提供部分原始代码例子,以便判断具体问题

板凳
小熊饼干b 发表于 2023-3-16 09:50:30
7945_1573892162 发表于 2023-2-28 10:21
会不会是分组回归时drop掉了一些singleton observations导致两组观测值相加不等于基准回归样本量?你用的什 ...
请问如果drop掉了是什么原因,影响分组回归结果吗

报纸
小熊饼干b 发表于 2023-3-16 09:50:53
你好,请问你解决了吗

地板
Letiziasy 发表于 2023-7-21 10:07:52
小熊饼干b 发表于 2023-3-16 09:50
请问如果drop掉了是什么原因,影响分组回归结果吗
如果是用reghdfe回归命令drop掉的话,其实是会使回归结果更准确的,是命令的问题,使用这个回归命令会drop掉。回归的时候如果drop掉它会给你返回这个问题,同时返回一个相关的参考文献,你点进去就可以看这个文献了。

7
赵安豆 发表于 2025-1-10 13:01:28
这个问题可能源于几个方面:

1. **数据分割问题**:即使你的分组变量没有缺失值,但可能在某些情况下,该变量的取值将样本分为两部分时,并不是所有原始数据都能被准确地划分进这两个组。例如,如果你是基于一个连续变量进行分组(比如收入水平),你可能会设定一些阈值来定义两个组。然而,在这种情况下,那些正好落在阈值上的观测可能在不同软件或不同的处理方式下被计算成属于A组还是B组。

2. **数据清洗**:在你进行基准回归分析和分组回归前,你是否对数据进行了某种形式的清洗?例如,移除了异常值、重复记录或是某些特定条件下的样本。这种操作可能会影响最终用于分析的数据集大小。

3. **随机性因素**:如果在分割数据时有使用到随机抽样(比如训练-测试分组),那么即使总体没有缺失数据,每次运行的结果也可能不同,导致两组的加和与基准回归的样本量不完全匹配。

处理方式:

1. **重新检查数据处理步骤**:确保你的数据清洗和预处理步骤不会无意识地排除某些记录。如果使用了随机抽样,请考虑固定随机种子,以便结果可复现。

2. **详细记录数据分割过程**:明确你如何定义每个组的成员资格标准,以及这些规则是否被正确应用到所有观测上。

3. **检查分组变量与目标变量之间的关系**:有时候问题可能不在数据处理本身,而是在于所选的分组方法是否真正反映了数据内部的结构或趋势。考虑使用描述性统计分析来检验不同组内的分布特性。

4. **报告和解释差异**:在你的研究报告中明确说明任何样本量不匹配的情况,并提供合理解释。如果这种偏差是由于合理的数据处理决策导致的,那么读者应该能够理解并接受这一点。
   
希望这些建议能帮助你解决遇到的问题!

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 15:17