楼主: 龙真
10153 7

[编程问题求助] stata根据同变量中的重复值如何生成新变量使数值为1 [推广有奖]

  • 1关注
  • 0粉丝

本科生

20%

还不是VIP/贵宾

-

威望
0
论坛币
31 个
通用积分
41.3912
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
502 点
帖子
29
精华
0
在线时间
127 小时
注册时间
2013-8-29
最后登录
2024-7-11

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在处理数据 里边的a5(与户主的关系)有许多缺失值。

但是这些缺失值在之前的调查年数据中是存在的  因此可以再重新赋值。

但是由于存在户主更换的问题  导致不可以简单地sort 再 carryforward

因此我想把数据分为  没有更换过户主 和 更换过户主两类

1.png

比如这张图  这家人的户主进行了更换

根据a5 和 wave 可以看出在2015年户主变成了孙辈

而问卷中外祖父母在a5中没有对应的值 所以导致 2015 年 a5为空值

2.png

再看这张图 由于户主没有更换 因此可以简单地赋值

我的问题是: 如何根据hhid idind line a5 来生成一个识别变量 识别出来他们有没有更换户主呢?

我个人的思路是如果a5在几个wave中的数值相同或为空值则这个新变量的值为0
                      如果更换了户主 即全家人的a5在不同的wave里有变化 那么这个新变量的值为1
印象当中是有根据重复值来确定频数的命令吧?
bys hhid idind a5: gen var1=_n ??? 我知道这个不对 所以过来求助。

当然也有可能我想得过于复杂 如果有更简单识别的方法也请教教我 感谢感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何生成新变量 Stata tata 重复值 新变量

沙发
龙真 发表于 2018-7-18 16:32:35 |只看作者 |坛友微信交流群
为何没有大神来回答呀 是不是我没有把问题说清楚??我再重新组织一边语言

我在处理数据的时候 发现a5有很多缺失值 (a5是与户主的关系)

缺失的原因分为两种
一种是户主更换了 所以有缺失值
另一种是户主没有更换 缺失原因不清楚 但是以前的wave中有对应的值 可以直接赋过来
上面两张图中 hhid=111102010 的是更换过户主的情况 很明显排序后a5乱成一团
                    hhid=111203018 的是没有更换过户主的情况 a5就很整齐 只需要把2015年的缺失值根据2011来重新赋值即可。

因此我想创建一个识别变量 来识别这家人有没有更换过户主

请问要如何写这条命令?


使用道具

藤椅
龙真 发表于 2018-7-18 16:49:27 |只看作者 |坛友微信交流群
再补充一下 数据就是CHNS的数据

使用道具

板凳
黃河泉 在职认证  发表于 2018-7-18 17:16:11 |只看作者 |坛友微信交流群
我实在看不懂你的问题!

使用道具

报纸
龙真 发表于 2018-7-19 17:42:42 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-7-18 17:16
我实在看不懂你的问题!
哎 那我再重新组织一下语言
我就是要识别这家人有没有更换过户主。
因为生老病死的关系 户主是会变化的 所以我要把更换过户主的家庭识别出来

昨天我的处理思路有点复杂了

今天的新思路是
按照家庭编号(hhid) 与户主的关系(a5) 年份(wave) 三个变量进行排序  
再根据可确定唯一性的个人编号(idind)来看看idind是否产生了变化
如果没有产生变化 那么应该是这样的
hhid    inind   a5   wave
111      001    0     2011
111      001    0     2015
111     002     1     2011
111     002     1     2015
111     003     2     2011
111     003     2     2015
这里排序后 对应不同的年份 idind没变

如果发生了变化 (假设003变成了户主)那么就应该是
hhid    idind   a5   wave
111      001    0     2011
111      003    0     2015
也就是排序后 idind 变了

那么问题来了 能够识别排序后的idind 有没有变化 就可以识别这家人有没有更换户主

所以 老师 命令要怎么写? bys hhid a5 wave: gen ??????

使用道具

地板
黃河泉 在职认证  发表于 2018-7-19 17:51:38 |只看作者 |坛友微信交流群
龙真 发表于 2018-7-19 17:42
哎 那我再重新组织一下语言
我就是要识别这家人有没有更换过户主。
因为生老病死的关系 户主是会变化的 ...
1. 看起來似乎比較清楚 (只有兩期吧?) 2. 你若要问程序,永远附上资料;若要附上资料,永远用 dataex 印出资料;先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

使用道具

7
黃河泉 在职认证  发表于 2018-7-19 17:54:31 |只看作者 |坛友微信交流群
龙真 发表于 2018-7-19 17:42
哎 那我再重新组织一下语言
我就是要识别这家人有没有更换过户主。
因为生老病死的关系 户主是会变化的 ...
此外,
  1. 111      001    0     2011
  2. 111      001    0     2015
复制代码
  1. 111     002     1     2011
  2. 111     002     1     2015
复制代码
有什么不一样?

使用道具

8
龙真 发表于 2018-7-19 18:47:01 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-7-19 17:54
此外,与有什么不一样?
huzhu.dta (4.48 MB)
不好意思 老师 我以后会规范问问题的方式
但是dataex命令今天安装不了呢。。
  1. connection timed out -- see help r(2) for troubleshooting
  2. http://fmwww.bc.edu/RePEc/bocode/d/ either
  3.   1)  is not a valid URL, or
  4.   2)  could not be contacted, or
  5.   3)  is not a Stata download site (has no stata.toc file).

  6. current site is still http://www.stata-journal.com/software/sj15-3/
复制代码

显示的是这个。

我再重新说一下我要问的问题
这个数据中a5存在缺失值 我需要补全缺失值
(a5表述于户主的关系 0表示户主 1表示配偶 2为父母 3为子女)
在观察中发现缺失的情况分为两种
  1. 1.户主更换了 造成了缺失
  2. 2.户主没更换 缺失原因不明 但是根据往年的记录可以进行补全
复制代码


所以我补全这个缺失值的思路是这样的,
  1. 1.将样本分为是否更换了户主两类
  2. 2.更换过户主的家庭如果样本量少就手动更改 样本量大再想别的办法
  3. 3.没有更换过户主的家庭可以
  4. bys idind: carryforward a5
  5. 这样就可以直接赋值
复制代码


拿家庭编号(hhid)为111102010 和 111304010 和 112102020 分别举例
  1. sort hhid a5 wave
复制代码

进行排序后 三个家庭分别为下图
1531996039637.jpg 1531996180519.jpg 1531996266205.jpg

111102010家庭在排序后 因为更换了户主 而户主的代号一直是0 所以对应到wave的idind发生了变化

111304010家庭也更换了户主 idind同样发生了变化

112102020家庭没有更换户主 因此对应到不同的wave 他们的idind是不变的

那么应该如何写这个识别命令 识别出来他们的idind对应到不同的年份没有变动过?


使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 18:47