楼主: 北极甜虾°
2290 5

[编程问题求助] 请问stata怎么删除包含相同姓名的数据 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

90%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
46 点
帖子
3
精华
0
在线时间
3 小时
注册时间
2020-9-18
最后登录
2020-9-29

楼主
北极甜虾° 发表于 2020-9-18 09:08:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如图两条数据都含“赵强”

想删除掉只有“赵强”的一条,保留“赵强,华光磊”这条

本人stata小白
求问大神程序该怎么写
]C3B[[K(X0A4M@QVK1]XFHY.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata STATA问题 Stata专版 stata数据处理 Stata stata编程

沙发
ritaing 发表于 2020-9-18 13:59:59
  1. drop if 分析师姓名=="赵强"
复制代码

藤椅
DΘstinyじò 发表于 2020-9-18 14:04:31
像"赵强"被包含在"赵强,华光磊"里面就删除"赵强"这一样本是吗?还有一个问题,要按证券代码分组吗?或者要按照别的变量分组讨论吗?
建议用dataex命令(ssc install  dataex)贴出示例数据,尽可能详细描述问题和数据结构。

板凳
北极甜虾° 发表于 2020-9-27 09:04:54
DΘstinyじò 发表于 2020-9-18 14:04
像"赵强"被包含在"赵强,华光磊"里面就删除"赵强"这一样本是吗?还有一个问题,要按证券代码分组吗?或者要 ...
谢谢您的回复,是的,要按照证券代码和年份分组,因为数据量很大无法实现一个一个drop,所以需要求助

报纸
北极甜虾° 发表于 2020-9-27 09:05:24
ritaing 发表于 2020-9-18 13:59
谢谢您的回复,这个是一个例子,数据量太庞大无法一个一个drop

地板
DΘstinyじò 发表于 2020-9-27 12:24:37
北极甜虾° 发表于 2020-9-27 09:04
谢谢您的回复,是的,要按照证券代码和年份分组,因为数据量很大无法实现一个一个drop,所以需要求助[sad ...
所以说,你要给出一点示例数据。问题描述越清晰,给的示例数据具有代表性,这样更能高效地让论坛里面的人帮助你解决问题。不得至少给出两年两个证券代码的数据?再说说重复的这个情况。
每个证券代码每年的组内样本,是只有这类情况?
A
A,B
还是,可能还会有
A
B
A,B

A
A,B
A,C
或者
A,B
A,B,C
要大致描述清楚这个要删除的情况。
尝试以下代码,不能解决最后一种情况的问题。
  1. split 分析师姓名,p(,) gen(temp)
  2. egen count=rcount(temp*),c(@!="")
  3. reshape long temp,i(证券代码 年份 分析师姓名) j(order)
  4. bys 证券代码 年份 temp (count): drop  if count==1 & _N>1
  5. drop if temp==""
  6. //duplicates drop 证券代码 年份 分析师姓名,force
  7. reshape wide temp,i(证券代码 年份 分析师姓名) j(order)
  8. drop temp* count
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 热心帮助其他会员

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-23 15:36