楼主: chaoqiuyuan9
6408 9

[数据] 最近在清洗CHNS数据库,有大佬能帮一下吗? [推广有奖]

  • 0关注
  • 0粉丝

本科生

60%

还不是VIP/贵宾

-

威望
0
论坛币
23 个
通用积分
0.0776
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
779 点
帖子
64
精华
0
在线时间
118 小时
注册时间
2017-4-8
最后登录
2024-12-15

楼主
chaoqiuyuan9 发表于 2022-3-26 10:01:02 |AI写论文
50论坛币
本人最近在清洗CHNS数据库,看到了这么庞大的数据(而且还是英文)有点无从下手,在初步的观察数据之后发现,CHNS数据库有大量的缺失值,而且我在处理ID那一块数据的时候就犯难了,对于rst_12和surveys_pud_12这两组数据存在以下疑问,首先是为什么两个数据集个人id的数量不同,再次是为什么每次调查的人数统计也不相同。有大佬能救救我这个可怜的孩子吗?分享一下处理CHNS数据库的经验。万分感谢!

微信截图_20220326095753.png (120.01 KB)

微信截图_20220326095753.png

微信截图_20220326095804.png (103.08 KB)

微信截图_20220326095804.png

微信截图_20220326095823.png (35.29 KB)

微信截图_20220326095823.png

微信截图_20220326095835.png (102.9 KB)

微信截图_20220326095835.png

最佳答案

biochemstone 查看完整内容

每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。
关键词:CHNS数据 CHNS 数据库 CHN Surveys

沙发
biochemstone 发表于 2022-3-26 10:01:03
每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。

藤椅
chaoqiuyuan9 发表于 2022-3-26 11:02:22
再问大家一下,CHNS中用于合并的唯一标识是什么呀?

板凳
biochemstone 发表于 2022-4-10 19:47:44
chaoqiuyuan9 发表于 2022-3-26 11:02
再问大家一下,CHNS中用于合并的唯一标识是什么呀?
IDIND是合并标识

报纸
chaoqiuyuan9 发表于 2022-4-24 18:06:04
biochemstone 发表于 2022-4-10 19:49
每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。
好的,已经明白啦,谢谢大佬~

地板
extra_ordinary 发表于 2022-7-3 21:49:28
chaoqiuyuan9 发表于 2022-3-26 11:02
再问大家一下,CHNS中用于合并的唯一标识是什么呀?
就是每个人的id

7
joyce.shi 发表于 2022-7-18 18:37:39
extra_ordinary 发表于 2022-7-3 21:49
就是每个人的id
那请问为什么同一个id在同一年份中会出现多条记录呢?记录内容中的hhid也不相同。

8
狼烟遍地 发表于 2022-8-20 16:47:41 来自手机
extra_ordinary 发表于 2022-7-3 21:49
就是每个人的id
请问一下,为什么用id去合并性别那个文件,显示id不是唯一关键变量?那么,性别该怎么合并进去呢

9
狼烟遍地 发表于 2022-8-20 16:50:02 来自手机
biochemstone 发表于 2022-3-26 10:01
每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。
那请问一下,性别数据能合并进去吗?

10
biochemstone 发表于 2022-9-4 09:23:25
狼烟遍地 发表于 2022-8-20 16:50
那请问一下,性别数据能合并进去吗?
当然可以合并进去。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 03:55