271 12

[数据管理求助] 面板数据处理问题 [推广有奖]

  • 0关注
  • 0粉丝

本科生

6%

还不是VIP/贵宾

-

威望
0
论坛币
737 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
669 点
帖子
39
精华
0
在线时间
77 小时
注册时间
2017-1-8
最后登录
2019-9-18

美丽的小蜜蜂 发表于 2019-5-15 16:14:42 |显示全部楼层
图.png

如图,现在我想把中间标红部分删除,因为一个pid对应着两个2014年,但问题是现在在几万个数据里有600多个类似这样的pid,一个一个删除很费时间,请问有没有什么快捷的方法可以用stata或者excel处理一下的?谢谢大家!

回帖推荐

ritaing 发表于10楼  查看完整内容

只要有pid对应的有两年,那么这个pid就全部删除? 如果是这样可以试试这个
stata SPSS
黃河泉 在职认证  发表于 2019-5-15 16:46:08 |显示全部楼层
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        请参考说明 https://bbs.pinggu.org/thread-5048204-1-1.html
回复

使用道具 举报

美丽的小蜜蜂 发表于 2019-5-15 17:29:10 |显示全部楼层
黃河泉 发表于 2019-5-15 16:46
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见 ...
. dataex pid year in 1/10

----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double pid float year
  4. 110003101 2010
  5. 110003101 2012
  6. 110003101 2014
  7. 110003101 2016
  8. 110003102 2010
  9. 110003102 2012
  10. 110003102 2014
  11. 110003102 2016
  12. 110006101 2010
  13. 110006101 2012
  14. end
  15. label values pid pid
复制代码
------------------ copy up to and including the previous line ------------------

Listed 10 out of 98024 observations
谢谢老师,但只列出前十个不能说明我的问题,我的数据异常第一次出现在第139个数上,我发的截图应该已经比较清楚地补充说明了我的问题,请问您能就我的问题提供一下处理建议吗
回复

使用道具 举报

黃河泉 在职认证  发表于 2019-5-15 18:17:26 |显示全部楼层
美丽的小蜜蜂 发表于 2019-5-15 17:29
. dataex pid year in 1/10

----------------------- copy starting from the next line ---------- ...
我需要实验一下,你提供没有用的资料一点帮助都没有!
回复

使用道具 举报

美丽的小蜜蜂 发表于 2019-5-15 18:21:23 |显示全部楼层
黃河泉 发表于 2019-5-15 18:17
我需要实验一下,你提供没有用的资料一点帮助都没有!
那请问我还需要上传什么吗?按照您发的指示这样也不行?
回复

使用道具 举报

美丽的小蜜蜂 发表于 2019-5-15 18:22:35 |显示全部楼层
美丽的小蜜蜂 发表于 2019-5-15 18:21
那请问我还需要上传什么吗?按照您发的指示这样也不行?
其实我只需要问一下大概用什么指令就行,并不一定就非要具体的可以让我直接复制粘贴过去的啊
回复

使用道具 举报

黃河泉 在职认证  发表于 2019-5-15 18:29:49 |显示全部楼层
美丽的小蜜蜂 发表于 2019-5-15 18:21
那请问我还需要上传什么吗?按照您发的指示这样也不行?
你上面提供的资料有异常吗?哪一笔?
回复

使用道具 举报

美丽的小蜜蜂 发表于 2019-5-15 19:49:12 |显示全部楼层
黃河泉 发表于 2019-5-15 18:29
你上面提供的资料有异常吗?哪一笔?
dataex pid year in 100/150

----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double pid float year
  4. 110033104 2016
  5. 110035101 2010
  6. 110035101 2012
  7. 110035101 2014
  8. 110035101 2016
  9. 110035102 2010
  10. 110035102 2012
  11. 110035102 2014
  12. 110035102 2016
  13. 110038101 2010
  14. 110038101 2012
  15. 110038101 2014
  16. 110038101 2016
  17. 110038104 2010
  18. 110038104 2012
  19. 110038104 2014
  20. 110038104 2016
  21. 110041101 2010
  22. 110041101 2012
  23. 110041101 2014
  24. 110041101 2016
  25. 110041102 2010
  26. 110041102 2012
  27. 110041102 2014
  28. 110041102 2016
  29. 110043101 2010
  30. 110043101 2012
  31. 110043101 2014
  32. 110043101 2016
  33. 110043102 2010
  34. 110043102 2012
  35. 110043102 2014
  36. 110043102 2016
  37. 110043103 2010
  38. 110043103 2012
  39. 110043103 2014
  40. 110043103 2016
  41. 110043106 2010
  42. 110043106 2012
  43. 110043106 2014
  44. 110043106 2014
  45. 110047101 2010
  46. 110047101 2012
  47. 110047101 2014
  48. 110047101 2016
  49. 110047102 2010
  50. 110047102 2012
  51. 110047102 2014
  52. 110047102 2016
  53. 110050102 2010
  54. 110050102 2012
  55. end
  56. label values pid pid
复制代码
------------------ copy up to and including the previous line ------------------

Listed 51 out of 98024 observations

不好意思老师,您看看这样可不可以,就是pid为110043106对应的year有两个2014,在样本容量很大的情况下怎样用命令删除这个pid对应的四年的数据
回复

使用道具 举报

ritaing 发表于 2019-5-16 04:05:35 |显示全部楼层
美丽的小蜜蜂 发表于 2019-5-15 19:49
dataex pid year in 100/150

----------------------- copy starting from the next line ---------- ...
只要有pid对应的有两年,那么这个pid就全部删除?
如果是这样可以试试这个
  1. duplicates tag pid year,gen(dup)
  2. bys pid:egen num=sum(dup)
  3. drop if num>0
复制代码
回复

使用道具 举报

ritaing 发表于 2019-5-16 04:09:15 |显示全部楼层
美丽的小蜜蜂 发表于 2019-5-15 19:49
dataex pid year in 100/150

----------------------- copy starting from the next line ---------- ...
恩,这个可以,但是太长了。将问题表达清晰简洁很重要^_^
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-9-19 17:16