楼主: LOVEJUAN789
9660 7

[数据管理求助] CHFS数据前期处理目前在做有关CHFS数据的 [推广有奖]

  • 0关注
  • 0粉丝

大专生

43%

还不是VIP/贵宾

-

威望
0
论坛币
5 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
313 点
帖子
21
精华
0
在线时间
69 小时
注册时间
2016-7-28
最后登录
2020-6-9

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位好,目前在做有关CHFS论文,数据有3个表,一个是个体数据,一个是家庭数据,还有一个MASTER,家庭的数据是适合对应的家庭成员个体的,想要请教各位如何把家庭的数据合并到对应的家庭成员个体数据上?新手一枚,知道要用merge 语句,但具体不太会用,希望各位会的大神指点一下啊,感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Master Aster Merge 家庭数据 数据合并 CHFS数据处理

沙发
芒果宝宝蛋 学生认证  发表于 2017-4-2 17:07:31 来自手机 |只看作者 |坛友微信交流群
你先用duplicates report 加变量名看变量是否unique
然后用merge 1:1或者1:m或者m:1或者m:m 加变量名 using 文件名
分别表示一对一,一对多,多对一,多对多的合并

使用道具

藤椅
芒果宝宝蛋 学生认证  发表于 2017-4-2 17:08:29 来自手机 |只看作者 |坛友微信交流群
或者也可以用duplicates drop 变量名删除重复的
后面可以加force选项

使用道具

板凳
yuant9 发表于 2017-4-3 17:24:26 |只看作者 |坛友微信交流群
芒果宝宝蛋 发表于 2017-4-2 17:08
或者也可以用duplicates drop 变量名删除重复的
后面可以加force选项
变量赋值好,之后需不需要检验啊,我没有检验、用probit模型跑出来的结果跟别人的很不一样

使用道具

报纸
芒果宝宝蛋 学生认证  发表于 2017-4-3 17:33:13 |只看作者 |坛友微信交流群
yuant9 发表于 2017-4-3 17:24
变量赋值好,之后需不需要检验啊,我没有检验、用probit模型跑出来的结果跟别人的很不一样
不太清楚你的情况,可能你把数据贴上来让大神们看一下才行
个人觉得,你可能是数据处理上的问题

使用道具

地板
xiaomogu960204 发表于 2017-5-21 20:59:00 |只看作者 |坛友微信交流群
楼主,我也在做CHFS方面的论文,但是申请不到数据,能不能麻烦你把数据发我一份呢?邮箱1172607084@qq.com,三克油!

使用道具

7
孤寂伤 发表于 2019-3-14 19:32:38 |只看作者 |坛友微信交流群
楼主,多谢,能不能麻烦你把数据发我一份呢?邮箱1176654289@qq.com

使用道具

8
赵安豆 发表于 2024-5-6 00:17:46 |只看作者 |坛友微信交流群
CHFS(中国家庭追踪调查)数据处理是社会科学研究中的一个重要环节,尤其是在处理涉及个体和家庭层面数据的合并时。具体到您的问题,您需要使用数据处理软件(如Stata、R、SPSS等)来执行数据合并操作。这里以Stata为例来说明如何合并家庭数据到对应的家庭成员个体数据上。

假设您的个体数据集命名为`individual.dta`,家庭数据集命名为`family.dta`,并且两个数据集中都含有可以连接个体和家庭的唯一标识符(比如家庭ID),下面是一个简化的merge操作步骤:

1. **加载个体数据集**:首先,您需要加载个体数据集到Stata中。
```stata
use individual.dta, clear
```

2. **合并家庭数据集**:使用`merge`命令将家庭数据集合并到当前加载的个体数据集中。假设连接两个数据集的键是`family_id`。
```stata
merge 1:m family_id using family.dta
```
这里`1:m`表示一对多合并,意味着一个家庭ID在`individual.dta`中可能对应多个记录(因为一个家庭有多个成员),而在`family.dta`中每个家庭ID只对应一个记录。

3. **检查合并结果**:合并后,Stata会生成一个名为`_merge`的变量,用于指示合并的结果。您可以通过查看`_merge`变量的分布来检查合并是否成功。
```stata
tab _merge
```
常见的`_merge`值包括:
- 1:表示仅在主数据集(个体数据)中有匹配;
- 2:表示仅在使用`using`命令指定的数据集(家庭数据)中有匹配;
- 3:表示两个数据集中都有匹配。

理想情况下,所有的记录都应该是`3`,即成功匹配。

4. **处理合并后的数据**:合并成功后,您可以继续对数据进行所需的分析或处理。如果有不匹配的情况,您可能需要检查数据中的`family_id`是否有误或进行适当的数据清洗。

5. **保存合并后的数据**:最后,别忘了保存您合并后的数据集。
```stata
save merged_data.dta, replace
```

请根据您具体使用的数据处理软件调整上述步骤,如果使用的是R或SPSS,合并数据的方法会有所不同,但基本思路是相似的。希望这能帮助您解决问题!

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-10-7 00:53