楼主: gonglele1018
8873 11

[面板数据求助] stata数据处理 [推广有奖]

  • 1关注
  • 0粉丝

初中生

95%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0.0513
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
233 点
帖子
4
精华
0
在线时间
31 小时
注册时间
2012-6-22
最后登录
2014-11-6

楼主
gonglele1018 发表于 2014-7-25 16:19:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大神,对于以下数据,如何通过stata实现,统计下对于每一位researcher ,对应他出现年份的个数,如果只出现一次,就将其删除掉,比如对于王海东,王丽妍 ,4个观察值都只出现一个2013年,故应删除,数据里面不一定每个人都只出现4次,这是截取的其中一部分数据,急用,小妹在线等答复,谢啦
coderesearcheryear
300259.SZ王海东

2013

601012.SH王海东

2013

002358.SZ王海东

2013

300066.SZ王海东

2013

600138.SH王朗其

2012

000428.SZ王朗其

2012

600754.SH王朗其

2013

300144.SZ王朗其

2013

002398.SZ王丽妍

2013

000786.SZ王丽妍

2013

002457.SZ王丽妍

2013

300198.SZ王丽妍

2013

600193.SH王攀

2010

601003.SH王攀

2010

000708.SZ王攀

2010

000778.SZ王攀

2010

000417.SZ王赛楠

2009

600628.SH王赛楠

2010

600327.SH王赛楠

2010

000501.SZ王赛楠

2009

300332.SZ王莎莎

2013

002123.SZ王莎莎

2013

300035.SZ王莎莎

2013

300011.SZ王莎莎

2013

600863.SH王野,皮舜

2006

000968.SZ王野,皮舜

2006

600395.SH王野,皮舜

2006

600971.SH王野,皮舜

2006

600642.SH王野,王晓辉

2005

600886.SH王野,王晓辉

2005

600795.SH王野,王晓辉

2005

600027.SH王野,王晓辉

2005


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:stata数据处理 STATA数据 Stata tata 数据处理 在线 如何 统计 王丽

沙发
hplcdadong 发表于 2014-7-26 05:41:24
ssc install egenmore, replace         //install the user-written command package
bysort researcher: egen tag=nvals(year)
drop if tag==1
已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
葫芦娃大王 + 10 + 5 精彩帖子
crystal8832 + 20 + 1 热心帮助其他会员
lambert0205 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 10  论坛币 + 25  学术水平 + 1  热心指数 + 2  信用等级 + 1   查看全部评分

藤椅
gonglele1018 发表于 2014-7-26 09:00:01
hplcdadong 发表于 2014-7-26 05:41
ssc install egenmore, replace         //install the user-written command package
bysort researcher: ...
太谢谢了,已经解决了,只是程序有一点没看懂,那个nvals具体是做什么的?我想更深入的学习下,stata里好像没有这个命令,刚接触stata,新手一枚,烦请多指教,谢啦

板凳
hplcdadong 发表于 2014-7-26 10:01:56
gonglele1018 发表于 2014-7-26 09:00
太谢谢了,已经解决了,只是程序有一点没看懂,那个nvals具体是做什么的?我想更深入的学习下,stata里好 ...
help egenmore

报纸
gonglele1018 发表于 2014-7-26 12:28:21
hplcdadong 发表于 2014-7-26 10:01
help egenmore
谢谢,我还有最后一个问题请教,就是对于以下数据,我想通过error和level两个变量来实现排序,最后将排序结果放在一个新的变量里,error越小,level越大,名次越靠前。先以error来比较,如果error相同了,就以level来作为排序的依据,若是二者都相同的话,就给与相同的名次,最后想要得到exp那一列数据。

id                   level              error               exp
600423.SH         9                0                  3
600028.SH         11                0                  2
600406.SH         9                0                  3
000729.SZ         14             0                1
000726.SZ         5                 0                  4
000625.SZ         14             0                  1
600723.SH         14             0.0002            5
000783.SZ         14          0.0007                   6
000012.SZ         14              0.0007           6
000623.SZ         14              0.0009                   7
600170.SH         12               0.001                   8
000024.SZ         7               0.001                  10
000927.SZ         12               0.001                   8
600832.SH         9               0.001                   9

地板
hplcdadong 发表于 2014-7-27 09:34:33
duplicates drop error level, force
gsort error -level
gen exp=_n

merge 1:m error level using rank,keep(match) nogen        //assume your original file name is "rank"
sort exp
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

7
gonglele1018 发表于 2014-7-27 09:55:21
hplcdadong 发表于 2014-7-27 09:34
duplicates drop error level, force
gsort error -level
gen exp=_n
很给力呀,谢谢啊,这个思路太别致了,只是有一个小问题是,为什么合并后数据里面丢失了一部分数据,比如id 为000625的也被变成了000729,00012变成了000783

8
gonglele1018 发表于 2014-7-27 10:53:12
gonglele1018 发表于 2014-7-27 09:55
很给力呀,谢谢啊,这个思路太别致了,只是有一个小问题是,为什么合并后数据里面丢失了一部分数 ...
找到解决办法了,把master data 换一下,变成merge m:1 level error  using tem1.dta, keepusing(exp) nogen
就可以了

9
hplcdadong 发表于 2014-7-27 11:30:59
Sorry, did not pay too much attention to the id variable. Your solution is excellent.

Here is another solution (don't have to change the master data):

duplicates drop error level, force
gsort error -level
gen exp=_n

merge 1:m error level using rank,update replace nogen       //assume your file name is "rank"
sort exp

10
gonglele1018 发表于 2014-7-27 12:30:55
hplcdadong 发表于 2014-7-27 11:30
Sorry, did not pay too much attention to the id variable. Your solution is excellent.

Here is an ...
哦,你这套方案更方便些,太强了,thank you !

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 14:50