楼主: sunny@RUC
1747 10

[统计软件与数据分析] 同样一组变量,对城市居民具有显著性,对农村居民不具有显著性。如何解释? [推广有奖]

  • 0关注
  • 0粉丝

已卖:7份资源

本科生

24%

还不是VIP/贵宾

-

威望
0
论坛币
58 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
16022 点
帖子
30
精华
0
在线时间
128 小时
注册时间
2011-5-29
最后登录
2021-9-11

楼主
sunny@RUC 发表于 2016-2-5 15:51:08 |AI写论文
20论坛币
我用一组变量(年龄、收入等)考察纠纷解决偏好。
当我将样本区分为“城市”和“农村”分别来做模型的时候,发现同样的变量在“城市”模型中都显著,但在“农村”模型中不显著。
这是什么原因?如何解释?

另:我选择的是logistic模型,不太明白这种模型下,如果要在STATA里做交互项,如何操作

关键词:城市居民 Logistic模型 logistic logisti ogistic 数据 如何 模型 样本

沙发
cyjun 发表于 2016-2-5 16:01:18
增加一个随机变量 试试!
已有 1 人评分论坛币 收起 理由
admin_kefu + 5 热心帮助其他会员

总评分: 论坛币 + 5   查看全部评分

藤椅
sunny@RUC 发表于 2016-2-5 20:50:22
cyjun 发表于 2016-2-5 16:01
增加一个随机变量 试试!
请问怎么加随机变量呢?

板凳
Shasha904 发表于 2016-2-5 23:07:23
这说明样本属于城市还是农村居民(属地),对年龄和收入两个自变量与解决纠纷的偏好之间的关系可能造成显著影响。
STATA的分析方法:在Logistic Regression模型中增加两个自变量:1:属地*年龄;2:属地*收入。
已有 1 人评分论坛币 收起 理由
admin_kefu + 15 热心帮助其他会员

总评分: 论坛币 + 15   查看全部评分

报纸
sunny@RUC 发表于 2016-2-6 09:44:28
Shasha904 发表于 2016-2-5 23:07
这说明样本属于城市还是农村居民(属地),对年龄和收入两个自变量与解决纠纷的偏好之间的关系可能造成显著 ...
线性回归模型中加入交互项我能用语言解释,但在logistic模型中的交互项怎么解释呢?

地板
Emma不惧Eco 发表于 2016-2-6 12:52:28
sunny@RUC 发表于 2016-2-6 09:44
线性回归模型中加入交互项我能用语言解释,但在logistic模型中的交互项怎么解释呢?
跟最开始你模型里的系数解释方法一样的
属地肯定是dummy variable,这样出来的logit模型只是多了一项而已,之前如何解释,现在也是那样解释,只不过变成了差值
我猜你是想问在可能性相关的模型里,系数如何解释。对吗?

7
kblian001 学生认证  发表于 2016-2-8 14:26:49
首先我的理解是,您把收入这个变量分成了两个维度,城市和农村来表示收入水平的高低,因此在逻辑回归中城市=1,农村=0。这样的话,我觉得产生两种不同的显著结果是很正常的。城市自变量显著而农村不显著,而因变量是纠纷解决偏好,那么可以解释为城市居民由于收入水平相对较高,那么在民事问题上的纠纷意愿会相对较高,而生活条件较低的农村居民在民事纠纷上的损失比较高的情况下,他们会认为自己的损失比较严重,因此对解决纠纷的态度表现消极。
另外,我只会用R做交互项,stata就无能为力了..
希望对您有帮助~
已有 1 人评分论坛币 收起 理由
admin_kefu + 5 热心帮助其他会员

总评分: 论坛币 + 5   查看全部评分

8
sunny@RUC 发表于 2016-2-8 17:24:52
kblian001 发表于 2016-2-8 14:26
首先我的理解是,您把收入这个变量分成了两个维度,城市和农村来表示收入水平的高低,因此在逻辑回归中城市 ...
不,我是分开做了两个模型。
一个模型是城市样本,一个模型是农村样本。
城市样本里,那些变量都显著。农村样本里,那些变量都不显著。
我在想这种情况怎么解释……

9
kblian001 学生认证  发表于 2016-2-8 20:10:54
sunny@RUC 发表于 2016-2-8 17:24
不,我是分开做了两个模型。
一个模型是城市样本,一个模型是农村样本。
城市样本里,那些变量都显著。 ...
哦哦我明白了,您是分别用两组样本做了两次模型,但是自变量都是年龄和收入。
但是我觉得您现在想做的是收入和年龄对纠纷解决偏好的影响,那么就找一堆样本直接做就可以了,为什么一定要区分样本呢?当然这样做也可以,只是做了两组模型之后为什么又要设置“收入”这个自变量呢?在我看来城市和居民两个样本本身就已经反映了收入水平的高低,也就是说,即使样本的方差比较大,城市样本的收入平均值一定是高于农村样本的。
所以我建议要么把所有样本放在一起做两个维度,要么区分自变量但是另外设置一个自变量。但是这样的话最后对回归结果的解释又不一样了,而且也无法判断收入对因变量究竟是否有影响。
如果一定要解释您目前得出的回归结果也是可以的。我觉得可以这样解释:高收入与纠纷解决偏好相关而低收入人群无法预测出他们的纠纷解决偏好。而年龄,正常来说不应该出现在不同群体有不同显著性的结果,因为年龄的回归系数与收入的高低是没有关系的。也就是说,无论是在城市还是农村的模型,年龄对因变量的显著性应该一致。所以我认为出现这种偏差的可能性应该是采集的样本本身的问题。也就是说,可能农村居民年龄的方差很小,大部分年龄都 集中在同一个区间,因此无法判断其显著性。建议检查一下描述性分析得到的结果。
希望对您有帮助~

10
sunny@RUC 发表于 2016-2-8 21:07:06
kblian001 发表于 2016-2-8 20:10
哦哦我明白了,您是分别用两组样本做了两次模型,但是自变量都是年龄和收入。
但是我觉得您现在想做的是 ...
感谢回答。
我不止两个自变量,有一组自变量,这两个只是举例~
我的理解是,会不会城市居民分化较大,农村居民分化不大?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 00:21