楼主: 陈罗炜
881 8

[数据求助] 关于CFPS变量qc401(过去12个月是否因病住院)缺失值的一个问题 [推广有奖]

  • 4关注
  • 1粉丝

硕士生

67%

还不是VIP/贵宾

-

威望
0
论坛币
691 个
通用积分
87.3672
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
2321 点
帖子
54
精华
0
在线时间
325 小时
注册时间
2009-12-1
最后登录
2025-6-4

楼主
陈罗炜 发表于 2023-10-24 11:07:28 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
CFPS中,qc401(过去12个月是否因病住院)这一变量的所有回答,包括缺失、不适用、拒绝回答等各种情况,加在一起的样本量共25082个,而总样本量共28530个,查看原始数据,发现这一变量的取值中有.,count if qc401==.得到结果是3448,这是缺失值吗?但是在变量取值的标签中已经定义过缺失情况的取值了,具体如下:

. label list qc401

qc401:

        -10 无法判断

         -9 缺失

         -8 不适用

         -2 拒绝回答

         -1 不知道

          0 否

          1 是

         79 情况不适用

. tab qc401

   过去12个 |

     月是否 |

     因病住 |

        院 |     Freq.     Percent        Cum.

------------+-----------------------------------

      缺失 |        17        0.07        0.07

     不适用 |        390        1.55        1.62

     不知道 |          2        0.01        1.63

        否 |    22,365       89.17       90.80

        是 |     2,308        9.20      100.00

------------+-----------------------------------

     Total |     25,082      100.00

缺失情况qc401的取值不就是-9吗?那么这3448个qc401==.的样本又代表什么意思呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:cfps 缺失值 CFP percent Count CFPS qc401 过去12个月是否因病住院 缺失值

沙发
陈罗炜 发表于 2023-10-28 12:12:30
第二个问题:2018年及以前年度的CFPS家庭经济库的数据中,关于收入的变量有fincome1和fincome2,都是家庭收入指标,区别是fincome2是与2010年可比的家庭收入,但是在CFPS2020的家庭经济库中,只有fincome1的相关变量,没有fincome2的相关变量了,为什么?

藤椅
康秀华 学生认证  发表于 2023-10-30 21:32:53
这个应该也是缺失值吧,我是按照缺失值直接处理了

板凳
陈罗炜 发表于 2023-11-1 11:35:33
第三个问题:在合并家庭经济库和个人库的过程中,发现同一家庭变量在两库中的取值可能存在冲突,比如家庭规模变量fml_count(家庭成员人数),以fid20的样本为例,在家庭经济库中,list fml_count if fid20==110024,fml_count=2,在个人库中,list fml_count if fid20==110024,fml_count=-8(不适用)。再如fid20=210386的样本,在家庭经济库中,list fml_count if fid20==210386,fml_count=3,在个人库中,tab fml_count if fid20==210386,fml_count取值有两,分别为3和-8(不适用),这是为什么?

报纸
陈罗炜 发表于 2023-11-1 12:16:50
第四个问题:接着第三个问题,我使用merge语句以及update replace语句合并家庭经济库和个人库,命令如下:
use "CFPS2020\cfps2020famecon_202306.dta",clear
merge 1:m fid20 using "CFPS2020\cfps2020person_202306", update replace
这样会把所有个人库中的变量取值替代和更新原有家庭经济库中相同变量的取值,现在如果我想在此基础上,仅让变量家庭规模fml_count保持来自主数据库,即家庭经济库的取值,应该如何改写命令?

地板
陈罗炜 发表于 2023-11-1 14:47:16
陈罗炜 发表于 2023-11-1 11:35
第三个问题:在合并家庭经济库和个人库的过程中,发现同一家庭变量在两库中的取值可能存在冲突,比如家庭规 ...
已找到答案:“我们计算人均家庭纯收入时采用了fml2016_count是因为现场受访者是根据fml2016_count中所包含的人员来回答经济问卷的”,因此应该选用家庭经济库中家庭规模变量fml_count。
详见:CFPS小课堂 | 数据使用 Q&A (2020 : 4)
https://www.isss.pku.edu.cn/cfps/cjwt/jtgxk/1356825.htm?eqid=9f16ad080001880200000005646ed1d2

7
陈罗炜 发表于 2023-11-3 22:42:58
第四个问题:个人自答问卷P2部分 医疗保险,问题p601您享有哪些医疗保险?(对应变量qp605_s*和qp605_a*)这一问题为多选问题,除选项78以上都没有 这一选项与其他选项是互斥选项外,其余几个医保选项均可多选,涉及重复参保问题(比如既参加各项居民医保又参加职工医保,甚至有些人公费医疗、职工医保、各项居民医保、补充医疗保险全都选,明显是乱填的),但从目前我国的医保发展程度来看,随着统一信息化平台的建设,重复参保问题基本已消除,并且城镇居民医保和新农合也基本实现合并,因此,应该修改问卷中的这一问题,除补充医保可多选外,其余几项都应该设置为互斥的单选项目,并且把选项中的3城镇居民医疗保险、5新型农村合作医疗和6城乡居民基本医疗保险合并为一项居民医保,这样也能简化这一变量的后续处理。

8
陈罗炜 发表于 2023-11-3 22:56:02
第六个问题:在计算和比较扣减医疗支出前后的家庭人均收入基尼系数时发现,部分被访者回答P605“您享有哪些医疗保险?”选择78以上都没有(变量qp605_a_78=1)的同时,对问题C701“不含已经报销或预计能报销的部分,过去 12 个月,您伤病所产生的“【CAPI】METOTAL”元费用中,您自家直接支付了多少元?”这一问题时,答案不等于医疗总花费(metotal)(即变量qc701不等于变量metotal的数值),这存在矛盾,没有参加医保就没有报销部分,因此所有医疗费用应该都由个人负担才对。可能的原因:1.ZF进行医疗救助,这部分被扣除了?2.亲戚朋友的接济救助,某些被访者认为这不属于自己的医疗支出所以扣除了?

9
Dayvn 发表于 2023-11-6 10:01:15
有缺失的数据直接删掉就好了。样本数够大,就不影响

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 13:58