16754 30

[数据求助] 利用CHFS做数据分析 请问里面的抽样权重应该如何处理呢 [推广有奖]

11
2391839976 发表于 2016-4-19 10:21:12
LIXUANHANK 发表于 2016-4-18 19:03
spss我也不会,stata是命令后面跟【aw = weight】或者有时候【pw = weight】
不好意思又打扰你,请允许我再问一个问题...应该是最后一个了...就是用CHFS的数据时,我是筛选了一部分数据的,如果我要做抽样权重,是应该将全部的数据按swgt进行加权,还是就我选的数据按swgt进行加权呢?

12
shupi.g 发表于 2016-4-22 16:06:15
您好,现在CHFS申请数据的时候好像出了点问题,申请不到,您能把数据发我一份吗?拜托拜托……
邮箱是huangleicufe@163.com
谢谢!!!!!!!

13
szjtianhua 发表于 2016-4-28 16:35:45
2391839976 发表于 2016-4-19 10:21
不好意思又打扰你,请允许我再问一个问题...应该是最后一个了...就是用CHFS的数据时,我是筛选了一部分数 ...
同问这一个问题,不知楼主解决了吗?

14
fairychild5 发表于 2016-5-14 00:06:44
伍Brother 发表于 2014-5-19 13:21
平时用的时候就是在后面加了权重而已wgt123,应该是每个人的收入不同,在全国的代表性也不同,11年的数据仅 ...
等了两年

15
yjbxjg 发表于 2016-12-25 19:37:07
2391839976 发表于 2016-4-19 10:21
不好意思又打扰你,请允许我再问一个问题...应该是最后一个了...就是用CHFS的数据时,我是筛选了一部分数 ...
你好,我也使用CHFS处理数据也遇到这个问题,想问你最后是怎么处理的?如何对所有变量进行抽样权重调整?还是只对部分使用的结果使用权重?

16
呼呼兔的胡图图 学生认证  发表于 2017-10-9 20:34:56
如果是统计分析,你要进行年龄的统计就只用年龄的。如果是回归,且是多阶段抽样(比如PPS)抽样,就要计算总体权重,在回归的时候用。STATA提供频率权重(FW),分析权重(AW),抽样权重(PW)和重要性权重(IW),具体语句详见help weight。有一篇文献可以提供思路,现附上。
已有 2 人评分论坛币 热心指数 收起 理由
日新少年 + 1 精彩帖子
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20  热心指数 + 1   查看全部评分

17
零点晓敏 学生认证  发表于 2019-3-17 10:25:34
呼呼兔的胡图图 发表于 2017-10-9 20:34
如果是统计分析,你要进行年龄的统计就只用年龄的。如果是回归,且是多阶段抽样(比如PPS)抽样,就要计算总 ...
您好,我想问一下,PPS抽样用哪个权重比较好啊?是pweight吗?

18
呼呼兔的胡图图 学生认证  发表于 2019-3-17 11:47:14
零点晓敏 发表于 2019-3-17 10:25
您好,我想问一下,PPS抽样用哪个权重比较好啊?是pweight吗?
你指的是Stata里边使用pweight吗?我是这么理解的哈,如果不对的话再讨论。如果用Stata使用抽样权重作为调节的话,确实应该使用pweight。Stata支持四种权重,具体可以help weight。
weight_Stata.png

pweight指的是这个样本被抽到的概率的倒数。
更多详细的内容参考一个PPT。见附件。 Johnson - Introduction to survey weights (PRI version).pdf (572.68 KB)
已有 1 人评分热心指数 收起 理由
日新少年 + 1 精彩帖子

总评分: 热心指数 + 1   查看全部评分

19
零点晓敏 学生认证  发表于 2019-3-17 17:04:35
呼呼兔的胡图图 发表于 2019-3-17 11:47
你指的是Stata里边使用pweight吗?我是这么理解的哈,如果不对的话再讨论。如果用Stata使用抽样权重作为调 ...
太感谢啦!正想好好学习一下权重呢!我在用卫计委2015年流动人口监测数据做分析,回归的时候权重变量用的是"w_l":个人标准化权数,它的构建方式如图片所示。我在回归的时候分别用了pw, aw和iw这三个,发现回归系数及R方等一模一样,唯一不同的是标准误

微信图片_20190317170347.png (435.59 KB)

微信图片_20190317170347.png

已有 1 人评分热心指数 收起 理由
日新少年 + 1 精彩帖子

总评分: 热心指数 + 1   查看全部评分

20
呼呼兔的胡图图 学生认证  发表于 2019-3-17 21:05:26
零点晓敏 发表于 2019-3-17 17:04
太感谢啦!正想好好学习一下权重呢!我在用卫计委2015年流动人口监测数据做分析,回归的时候权重变量用的 ...
之前还没有特意关注过呢,托您的福,以后关注一下~上图应该是权重的计算方式,一般数据库附的都有计算好的各种权重,比如家户无响应权重、个人无响应权重等。如果要理解权重在回归模型中的计算方式,建议可以进一步阅读Green的书Econometric Analysis(Sixth Edition)的第八章广义回归模型,尤其是8.4、 8.6 、8.7(pp158-pp170)。
8.4.png
8.6.png
已有 2 人评分热心指数 收起 理由
嗯哼嗯哼蹦 + 1 精彩帖子
日新少年 + 1 精彩帖子

总评分: 热心指数 + 2   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-19 06:33