楼主: szz1990723
5793 9

[数据管理求助] 关于stata重复数值的处理问题,急!! [推广有奖]

  • 1关注
  • 1粉丝

已卖:22份资源

博士生

86%

还不是VIP/贵宾

-

威望
0
论坛币
228 个
通用积分
5.4011
学术水平
2 点
热心指数
2 点
信用等级
0 点
经验
3942 点
帖子
66
精华
0
在线时间
620 小时
注册时间
2012-7-16
最后登录
2025-8-19

楼主
szz1990723 发表于 2014-9-29 13:30:06 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在用stata做数据处理时,我遇到了一个问题,恳请大家的帮助,表格中左边是家庭代码,数值相同表示一个家庭,右边是家庭成员的出身日期,请问如果我想删除一个家庭中年龄差距小于20岁的样本应该如何操作?因为有些家庭有三个成员,只需计算只有两个家庭成员的样本,就是说如果两个家庭的年龄差距小于20岁,就把这个家庭样本删除,非常感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 重复数 非常感谢 如何操作 stata 重复值数据处理

MR`RMKA%CG7I]_1BP[1BIRP.jpg (20.4 KB)

MR`RMKA%CG7I]_1BP[1BIRP.jpg

沙发
leewinjing 发表于 2014-9-29 13:53:43
先生成年龄gen age=2014-qaly+1
by fid, sort: egen max=max(age)

. by fid, sort: egen min=min(age)


. gen gap=max-min

. drop if gap<=20
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 分析的有道理
SpencerMeng + 20 + 1 + 1 精彩帖子,讲解很详细。

总评分: 论坛币 + 30  学术水平 + 2  热心指数 + 2   查看全部评分

藤椅
emilychou 发表于 2014-9-29 16:47:21
这个不属于重复数值的处理问题

板凳
szz1990723 发表于 2014-9-29 18:20:07
leewinjing 发表于 2014-9-29 13:53
先生成年龄gen age=2014-qaly+1
by fid, sort: egen max=max(age)
真是太感谢你了!这个方法很好,我还有两个问题,不知你能否帮我一下,第一个是因为有些家庭有三个或以上人数,那么如果我想保留年龄从大到小在前两位的成员,删除这个家庭中剩下的成员,该怎么办?第二个问题是:如果第一个问题解决了,那每个家庭只有两个成员了,那我怎么样才能把他们分开?比如年龄较大者为父亲变量,年龄较小者为儿子变量,具体一点就是因为我有每个成员的收入数据,我需要生成一个父亲变量和一个儿子变量,变量值就是他们的收入,然后就是把父亲和儿子做回归。真心希望您能帮我解决这个忙,感激不尽!

报纸
xiaofengshen 发表于 2014-9-29 21:39:55
假设你上面的变量还有一个叫做income
问题1:
sort fid qaly
bys fid: gen ord=_n
drop if ord>2
问题2:
reshape wide qaly income, i(fid) j(ord)
然后就可以回归了,qaly1,income1是父亲,qaly2,income2是儿子
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

地板
szz1990723 发表于 2014-9-30 14:55:14
xiaofengshen 发表于 2014-9-29 21:39
假设你上面的变量还有一个叫做income
问题1:
sort fid qaly
谢谢!在运行过程有一个问题就是我一个样本有几百个变量,变成宽的的话好像不匹配,是不是需要弄到excel里先?

7
xiaofengshen 发表于 2014-9-30 16:58:09
我觉得用数据的大忌之一就是把数据在不同软件直接copy and paste。你不会全部要几百个变量分析的吧,你何不把要用的保留, 其他无关的drop掉。。。

8
szz1990723 发表于 2014-9-30 22:13:25
xiaofengshen 发表于 2014-9-30 16:58
我觉得用数据的大忌之一就是把数据在不同软件直接copy and paste。你不会全部要几百个变量分析的吧,你何不 ...
谢谢!可是即使只保留一些,还是无法在reshape命令后加上年龄这些个体异质性数据,所以还是需要把这些删除吧?不然reshape无法运行啊。另外,你能告诉我by和bys的作用吗?谢谢了!

9
xiaofengshen 发表于 2014-10-1 17:12:21
你回归的时候一个fid是一行还是两行?
如果是1行的话,年龄这个个体差异的变量的处理方法和收入是一样的,写程序的时候是写在收入那个位置的,reshape后也会变成age1,age2等等。
-bys-等于是-bysort-,是会有sort的过程。

10
szz1990723 发表于 2014-10-2 12:15:23
xiaofengshen 发表于 2014-10-1 17:12
你回归的时候一个fid是一行还是两行?
如果是1行的话,年龄这个个体差异的变量的处理方法和收入是一样的, ...
我懂了谢谢你啊!帮了我的大忙。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-23 09:03