楼主: peyzf
1681 3

[Stata高级班] 删除重复记录且保存完整信息 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566735 个
通用积分
200.4746
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132065 点
帖子
12769
精华
0
在线时间
2976 小时
注册时间
2007-9-8
最后登录
2025-10-10

楼主
peyzf 发表于 2014-8-12 22:17:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如下表,id中存在多个相同记录,但x*在每个id记录值中均不完整

id

x2

x3

x4

x5

1

3

1

5

1

国有企业

1

2

11

2

10

2

私营企业

2




如何得到如下想要的结果?

id

x2

x3

x4

x5

1

3

5

国有企业

2

11

10

私营企业


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:私营企业 国有企业 记录 信息

沙发
peyzf 发表于 2014-8-12 22:18:15
其中x*既包括数值型变量,又包括字型型变量。

藤椅
arlionn 在职认证  发表于 2014-8-30 09:19:19
这个结果没有什么意义吧。

如果一定要处理,给你如下思路。
1. 先把文字变量采用 encode 命令转换为数值变量;
2. 对每个变量执行 bysort id: egen x_new = min(x) 命令,扩充观察值;
3. 使用 duplicates 命令删除重复值。

板凳
peyzf 发表于 2014-8-30 23:09:53
thanks~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-5 15:24