楼主: IVY1996
1930 4

[统计软件与数据分析] 模型中自变量已经含年龄控制变量,进一步限制样本的年龄有何意义? [推广有奖]

  • 0关注
  • 1粉丝

已卖:50份资源

硕士生

27%

还不是VIP/贵宾

-

威望
0
论坛币
120 个
通用积分
1.2121
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
842 点
帖子
95
精华
0
在线时间
185 小时
注册时间
2016-9-4
最后登录
2025-12-6

楼主
IVY1996 发表于 2019-11-17 14:31:47 |AI写论文
5论坛币
在陆铭老师一篇论文中,为了推翻”无城市户口的流动人口和城市居民在储蓄率的差异,是由家庭层面上的一些因素存在差异而导致的“这一猜测,在稳健性检验中进一步限定了样本的年龄。

老师在文中写道,“城市居民和流动人口的年龄结构不同。流动人口年龄较小,90%以上的移徙家庭户主年龄在50岁以下,所以在稳健性检验中,将样本限定为50岁或50岁以下户主家庭的子样本。“

我的疑问是,原模型中自变量已经包含年龄,为何还要进一步将样本限定为50岁以下?
已经包含年龄这个变量,是否可以认为就已经剔除了年龄的影响?
另外,在未限定样本的结果中,年龄对因变量(储蓄率)无显著影响,但是限定样本后,则显著了,这又是为什么呢?



关键词:控制变量 自变量 何意义 稳健性检验 流动人口

沙发
GDSTW 发表于 2019-11-19 09:47:30
模型中包含年龄这个变量,不是剔除了年龄的影响,而是考虑到了年龄的影响,并且控制了这种影响,这样才能识别出在年龄一定的情况下,核心自变量对因变量的影响。
样本限定年龄,是考虑到样本选择的问题,城市居民和流动人口的都有效的样本量是集中在50岁以下的,50岁以上的样本可能都是城市居民样本而没有流动人口。如果没有进行样本的这种年龄限定,可能就会出现,50岁以上的样本过多,导致我们真正想识别的城市居民和流动人口的储蓄率差异 很微弱。
限定样本之后,显著的原因可能就在于前面所述的这种样本选择的问题。
我是个初学者,以上所述,仅作参考吧。

藤椅
X小青 学生认证  发表于 2019-11-19 17:44:30
模型中包含年龄变量,是考虑到年龄的影响,并控制了这种影响,这样才能识别出在控制了年龄一定的情况下,核心自变量对因变量的影响。样本限定年龄是样本选择问题,有效样本量集中在50岁以下,可能是因为50岁以上的样本不能同时满足城市居民和流动人口的条件,否则可能会出现城市居民和流动人口的储蓄率差异 很小。
限定样本之后,结果会更加显著。

板凳
IVY1996 发表于 2019-12-23 20:49:05
GDSTW 发表于 2019-11-19 09:47
模型中包含年龄这个变量,不是剔除了年龄的影响,而是考虑到了年龄的影响,并且控制了这种影响,这样才能识 ...
谢谢!

报纸
IVY1996 发表于 2019-12-23 20:50:32
X小青 发表于 2019-11-19 17:44
模型中包含年龄变量,是考虑到年龄的影响,并控制了这种影响,这样才能识别出在控制了年龄一定的情况下,核 ...
谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 18:02