楼主: glennyss
5896 7

[其他] 如何在STATA中计算CHNS数据下面每个妇女曾生子数? [推广有奖]

  • 1关注
  • 0粉丝

初中生

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
55 点
帖子
7
精华
0
在线时间
17 小时
注册时间
2010-8-26
最后登录
2014-9-25

楼主
glennyss 发表于 2012-3-1 20:27:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位好~!小女用CHNS数据做论文,有个问题纠结好久不得其解,望各位指教。问题是这样:我需要统计数据库中每个妇女的曾生子数,两代户和三代户中祖母辈生育子女数我已经计算出来,纠结的是三代户中儿媳妇和女儿的曾生子数,在CHNS数据中有一个变量是孙辈的母亲的家庭和个人编号,我个人认为这个变量很重要,但问题的关键是一些三代户中有多个儿媳妇和孙辈,或是某个家庭的某个儿媳在前n个wave中可以看出有一个子女,到第n+1个wave时她又生了一个孩子,于是我就凌乱不知所措了...我也试了一些很笨的方法,结果很差。麻烦各位STATA高手帮帮忙吧,不胜感激~!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CHNS数据 Stata tata CHNS CHN 儿媳妇 数据库 如何 论文 统计

沙发
夸克之一 发表于 2012-3-1 20:44:14
以第三代为基准,统计他们的父母兄弟姐妹数量(现成有这个变量),就可以知道祖母辈生育数量。对于一个三代户家庭,每个孩子可以与父母匹配,所以第二代的生育数也是直接可得的。第三代是孩子,没有生育数。

藤椅
glennyss 发表于 2012-3-1 20:58:07
夸克之一 发表于 2012-3-1 12:44
以第三代为基准,统计他们的父母兄弟姐妹数量(现成有这个变量),就可以知道祖母辈生育数量。对于一个三代 ...
哇塞,久仰久仰~
你的意思我明白,祖母辈生育数量我计算过了,孩子和父母的匹配我也有,就是你说的第二代生育数我搞不出来,能再说的详细点吗?不过话说我凹凸了,你说的第三代的父母兄弟姐妹数量的变量是指哪个?我还真没有印象...

板凳
夸克之一 发表于 2012-3-1 21:47:10
glennyss 发表于 2012-3-1 21:58
哇塞,久仰久仰~
你的意思我明白,祖母辈生育数量我计算过了,孩子和父母的匹配我也有,就是你说的第二代 ...

分开说,不然会乱。

1 父母的兄弟姐妹数量: m10wed(婚姻)中的s216 s218 s220 s222,问了夫妻双方的兄弟姐妹数量。以这个问基准就知道祖母辈的生育数。

2 第二代(母亲)生育数量:m07cprel (子女与父母关系)中的 dad_h dad_l mom_h mom_l提供了亲生父母的家庭号及家庭内部序列号,由此可以与子女匹配。匹配完毕之后可以计算出一对夫妻生育了多少孩子。
在一个包含全部样本信息的文件中先给每个人编号(为表示区别分父母,但三组编号内容是完全一样的)
gen double iid=hhid*1000+line
gen double iid_father=hhid*1000+line
gen double iid_mother=hhid*1000+line

然后在 m07cprel中
gen double iid_father=dad*1000+dad_l
gen double iid_mother=mom*1000+mom_l

最后将你要用的原始文件(以它为master file)与m07cprel合并。

这样新数据中有hhid,iid,iid_father, iid_mother. 现在,按照这个文件,无论这个家庭有几代人都无所谓。
gen n=1
bysort iid_mother: gen nkids=total(n)
这样,假如iid没有可以匹配的父母,一般而言(除了第三代孩子直接做户主的)就是第二代且两代户(无法找到他们的父母)。如果是三代户,无法匹配父母的实际是第一代人。剩下的情况(1,两代户,那么结果就是母亲生育的子女;2,三代户,结果为祖母生育数,母亲生育数)都可以自动计算,出来的结果应该是对的。

考虑离婚或者其他因素,可能这个命令需要加一些附加条件(if married==1比如),但大致应该是这么个方向。  

这个方法最大的缺陷是只能计算尚且存活的孩子数量,会遗漏已经死亡的人。但方法1应该是比较接近实际的,父母的兄弟姐妹数量包括活着的和已经过世的。

由于m07cprel也提供了祖父母的id信息(其实方法2对三代户而言已经把祖孙匹配了),所以同样的方法你也可以去算一下,然后用这个数字与方法1对比,看看差别大概有多少。如果方法2测算出来的祖母生育数与方法1直接变量统计的结果差别不显著(算个t值看看),那应该过得了关。

最后,我觉得如果你关注孩子数量最靠谱的办法还是去查census。。。尽管里面没有死亡的人口。。如果是查生育纪录,父母的兄弟姐妹数量那个指标比较靠谱。如果方法1和2的差别比较大,那就要还原死亡人口。我还没有想到如何把死亡人口算进去的方法,这个估计要花点时间想。。临时解决不了。。
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
无心之客 + 1 + 1 + 1 精彩帖子
Sunknownay + 3 + 3 + 3 热心帮助其他会员

总评分: 学术水平 + 4  热心指数 + 4  信用等级 + 4   查看全部评分

报纸
glennyss 发表于 2012-3-2 07:10:11
夸克之一 发表于 2012-3-1 13:47
glennyss 发表于 2012-3-1 21:58
哇塞,久仰久仰~
你的意思我明白,祖母辈生育数量我计算过了,孩子和父 ...
不好意思,下午有事耽误了。待我实际操作完了再向你汇报情况~

地板
夸克之一 发表于 2012-3-2 07:51:47
glennyss 发表于 2012-3-2 08:10
不好意思,下午有事耽误了。待我实际操作完了再向你汇报情况~
里面可能会有细节问题。。

7
gmt96430 发表于 2020-12-6 10:31:30
glennyss 发表于 2012-3-2 07:10
不好意思,下午有事耽误了。待我实际操作完了再向你汇报情况~
您好,抱歉冒昧打扰您,请问楼主的问题解决了吗,这个方法可行不?我现在也遇到了同样的问题

8
gmt96430 发表于 2020-12-6 11:33:48
夸克之一 发表于 2012-3-1 21:47
glennyss 发表于 2012-3-1 21:58
哇塞,久仰久仰~
你的意思我明白,祖母辈生育数量我计算过了,孩子和父 ...
您好!请问m07cprel是需要自己再去申请的数据吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 16:08