楼主: athas_pro
29157 7

[求助]全样本回归后,再分组回归,审稿人提意见说两组样本量差距太大,怎么办? [推广有奖]

  • 0关注
  • 4粉丝

讲师

4%

还不是VIP/贵宾

-

威望
0
论坛币
531 个
通用积分
8.1447
学术水平
2 点
热心指数
3 点
信用等级
2 点
经验
4093 点
帖子
49
精华
0
在线时间
750 小时
注册时间
2008-5-19
最后登录
2025-12-7

楼主
athas_pro 发表于 2015-9-19 23:25:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我的论文是以Y为变量,X为主要解释变量,Z为01变量,还有其他控制变量。先全样本回归出Y和X的关系,然后再验证Z对Y-X之间关系的调节效应。
第一次审稿人提出要把Z分0、1组来分组对Y-X做回归,强化结论。
第二次我按他说的做了以后,结果又提出意见说Z=0组的样本900多个,Z=1的样本200个左右,两组差距太大,分组回归的结果不可靠。

求教高手,这种情况怎么处理?Z的调节效应本身是个辅助,主要我是要做Y和X的关系,现在被搞的一直关注这个Z。而且样本就是这个样子,完全不知道该怎么办了,头都要爆炸啦。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分组回归 怎么办 样本量 审稿人 调节效应 样本 而且 论文 左右

本帖被以下文库推荐

沙发
xddlovejiao1314 学生认证  发表于 2015-9-28 18:47:11
   个人是不建议通过类别变量Z将样本人为的分成两组来分开做回归,这样做可能导致样本选择偏误(即全样本代表的总体和分组后各个组代表的总体可能会不一样了)。所以直接构建一个综合模型为好。
    楼主其实就是想检验一下Z对X与Y关系间的作用,构建一个模型:Y=a*x+b*z+c*x*z+控制变量+u就好了。不过在构建这个模型时,为了避免多重共线性的影响,应该先将X中心化,然后再构建模型。祝好运~
已有 2 人评分论坛币 热心指数 信用等级 收起 理由
sucheng199099 + 4 精彩帖子
admin_kefu + 25 + 2 热心帮助其他会员

总评分: 论坛币 + 25  热心指数 + 4  信用等级 + 2   查看全部评分

藤椅
athas_pro 发表于 2015-10-20 17:23:06
xddlovejiao1314 发表于 2015-9-28 18:47
个人是不建议通过类别变量Z将样本人为的分成两组来分开做回归,这样做可能导致样本选择偏误(即全样本代 ...
事实上我本来就是这么做的,但是审稿人一直说要分组,结果又导致不理想的结果。
后来害的我对整个数据的计算方式都做了调整,累死了

板凳
athas_pro 发表于 2015-10-20 17:23:08
xddlovejiao1314 发表于 2015-9-28 18:47
个人是不建议通过类别变量Z将样本人为的分成两组来分开做回归,这样做可能导致样本选择偏误(即全样本代 ...
事实上我本来就是这么做的,但是审稿人一直说要分组,结果又导致不理想的结果。
后来害的我对整个数据的计算方式都做了调整,累死了

报纸
xddlovejiao1314 学生认证  发表于 2015-10-20 17:31:17
athas_pro 发表于 2015-10-20 17:23
事实上我本来就是这么做的,但是审稿人一直说要分组,结果又导致不理想的结果。
后来害的我对整个数据的 ...
  额,这个可以尝试着解释一下啊。

地板
sweetie12345 发表于 2016-4-8 21:39:32
xddlovejiao1314 发表于 2015-9-28 18:47
个人是不建议通过类别变量Z将样本人为的分成两组来分开做回归,这样做可能导致样本选择偏误(即全样本代 ...
您好,我想问下我的论文中涉及到多维度变量的调节效应,我的调节变量有4个维度,自变量有2个维度,因变量有3个维度。可不可以将自变量的两个维度计算因子得分代表这个自变量,因变量也用因子得分来代替,这样才好做调节效应的交互项。不知道这样是否合理?

7
蛐蛐/跳跳 发表于 2019-1-10 15:47:59
sweetie12345 发表于 2016-4-8 21:39
您好,我想问下我的论文中涉及到多维度变量的调节效应,我的调节变量有4个维度,自变量有2个维度,因变量 ...
请问这个问题解决了吗?

8
赵安豆 发表于 2024-11-30 22:55:53
面对审稿人提出的关于分组样本量差距太大的问题,您可以尝试以下几种策略:

1. **使用权重**: 在回归分析中给较小的组(即Z=1)赋予较高的权重。这样做可以减少样本量差异带来的影响,确保两组数据在分析中的代表性。

2. **采用倾向得分匹配(PSM)或逆概率加权(IPW)**: 这些方法可以帮助您平衡Z=0和Z=1两个组之间的观测值数量,从而更公平地比较两者。通过这些技术,您可以构建一个“虚拟”样本,其中两组的大小更加接近。

3. **进行子样本稳健性检验**: 在回归分析中,不仅使用整个样本,还对一些随机抽取的小样本(如Z=1组)做同样的分析。如果结果在小样本和大样本中都一致,那么可以增强结论的可靠性。

4. **增加透明度**:清晰地报告为什么两组样本量差异显著,并解释这是否可能影响研究结果。同时,讨论这个局限性并提出未来研究的方向。

5. **采用合成控制法**: 如果Z=1的组样本过少,可以尝试使用与Z=0相同特征的其他观测值来构建一个“合成”对照组,以进行更可靠的比较。

6. **使用多水平模型或混合效应模型**: 这种方法能有效处理小样本问题,特别是当研究涉及多个层面的数据时。这些模型能够更好地考虑数据中的层次结构,并提高分析效率。

7. **Bootstrap 方法**:通过重新抽样技术来估计小样本组的参数分布和标准误。这种方法有助于评估回归系数的稳定性,尤其是在样本量较小的情况下。

在采取上述措施的同时,请确保您的研究方法论部分详细说明所采用的方法和原因,以便审稿人能理解您如何解决他们关心的问题。此外,在回复意见中明确表达您是如何处理该问题,并解释为什么认为这不会影响研究结果的有效性也非常重要。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 06:03