楼主: peyzf
1432 3

[Stata高级班] 删除重复记录且保存完整信息 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566901 个
通用积分
188.0557
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132146 点
帖子
12796
精华
0
在线时间
2969 小时
注册时间
2007-9-8
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如下表,id中存在多个相同记录,但x*在每个id记录值中均不完整

id

x2

x3

x4

x5

1

3

1

5

1

国有企业

1

2

11

2

10

2

私营企业

2




如何得到如下想要的结果?

id

x2

x3

x4

x5

1

3

5

国有企业

2

11

10

私营企业


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:私营企业 国有企业 记录 信息

沙发
peyzf 发表于 2014-8-12 22:18:15 |只看作者 |坛友微信交流群
其中x*既包括数值型变量,又包括字型型变量。

使用道具

藤椅
arlionn 在职认证  发表于 2014-8-30 09:19:19 |只看作者 |坛友微信交流群
这个结果没有什么意义吧。

如果一定要处理,给你如下思路。
1. 先把文字变量采用 encode 命令转换为数值变量;
2. 对每个变量执行 bysort id: egen x_new = min(x) 命令,扩充观察值;
3. 使用 duplicates 命令删除重复值。

使用道具

板凳
peyzf 发表于 2014-8-30 23:09:53 |只看作者 |坛友微信交流群
thanks~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 15:27