楼主: Jykaner
407 2

[Stata初级班] 如何删除时间序列数据的特定变量和特定观察值 [推广有奖]

  • 1关注
  • 0粉丝

本科生

0%

还不是VIP/贵宾

-

威望
0
论坛币
20 个
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
885 点
帖子
40
精华
0
在线时间
60 小时
注册时间
2018-3-2
最后登录
2018-9-10

Jykaner 发表于 2018-3-14 16:57:00 |显示全部楼层
本帖最后由 Jykaner 于 2018-3-14 17:03 编辑

连老师好,刚开始学Stata,遇到一个数据处理的问题,希望能得到您的帮忙。
时间序列数据,样本一共有7000+变量,每个变量有9000+观察值。
1. 其中大约有1000个变量的所有观察值都是相同的,需要找到并且删除这些变量,比如comp6,请问如何处理?
2. 另外还有一些变量,从某一天开始,之后所有日期的观察值相同,也需要找到这些变量,同时保留变量而仅仅将后面相同的观察值删除,比如comp7,请问如何处理?


  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(date1 comp5 comp6 comp7 comp8 comp11 comp12 comp13 comp14 comp15 comp16 comp36 comp37 comp38 comp39 comp40)
  4. 16349  28.5 132.38    3  8.34    48 . 139.5  66.5 1.05 250.13 73.75   245 205 178   585
  5. 16350  28.5 132.38    3  8.34    48 . 139.5    67 1.05 250.13 73.75   260 205 178   592
  6. 16351  28.5 132.38    3  8.34    48 .   140    67 1.05 250.13 73.75 264.5 205 178   592
  7. 16352    28 132.38    2  7.94    48 . 138.5    67 1.05 250.13 73.75   261 205 178   594
  8. 16355    28 132.38    2  7.94    48 .   138  66.5 1.05 255.08 73.75   261 205 178 592.5
  9. 16356    28 132.38 1.75  7.94    48 .   137  64.5 1.05 255.08 73.75   261 205 178 581.5
  10. 16357  30.5 132.38 1.63  7.54    48 .   135    64 1.05 255.08 73.75   261 205 178 592.5
  11. 16358  30.5 132.38 1.63  7.54    48 .   135    64 1.05  252.6 73.75   261 205 178 600.5
  12. 16359  30.5 132.38 1.63  7.54    48 .   135    64 1.05  252.6 73.75   261 205 178 603.5
  13. 16362  30.5 132.38 1.63  7.15 47.25 . 134.5 64.25 1.05  252.6 73.75   260 205 178   608
  14. 16363  30.5 132.38 1.63  7.15 47.25 . 134.5 64.25 1.05 250.13 73.75   260 205 178   610
  15. 16364  30.5 132.38 1.63  6.95 47.25 . 134.5  65.5 1.05 250.13 73.75   260 205 178   609
  16. 16365  30.5 132.38 1.75  6.95    47 . 133.5    67 1.05  252.6 73.75   260 205 178 609.5
  17. 16366    31 132.38 1.63  7.15    46 .   134    67 1.05 247.65 73.75   260 205 178   612
  18. 16369    31 132.38 1.63  7.74    45 .   134    67 1.05 247.65 73.75 258.5 205 178   607
  19. 16370  31.5 132.38 1.63  7.35  44.5 .   134    67 1.05 245.17 73.75 258.5 205 178 610.5
  20. 16371  31.5 132.38 1.63  7.35    44 .   134    67 1.05 245.17 73.75 257.5 205 178   617
  21. 16372  31.5 132.38 1.63  7.35  43.5 .   136    67 1.05 245.17 73.75 257.5 205 178 626.5
  22. 16373  31.5 132.38 1.63  7.35 42.25 .   137    67 1.05 245.17 73.75   255 205 178   632
  23. 16376 31.25 132.38 1.63  7.15  38.5 .   137    67 1.05 247.65 73.75   255 205 178   633
  24. 16377    31 132.38 1.63  7.15  38.5 .   137    67 1.05 247.65 73.75   255 205 178 630.5
  25. 16378    31 132.38 1.63  7.15 38.75 .   137  67.5 1.05 247.65 73.75   255 205 178   634
  26. 16379 30.75 132.38 1.63  7.15  39.5 .   137  67.5 1.05  252.6 73.75   255 205 178 635.5
  27. 16380    31 132.38 1.63  7.15 43.25 .   137  67.5 1.05  252.6 73.75   255 205 178   641
  28. 16383    31 132.38 1.63  7.15  46.5 . 136.5  67.5 1.05  252.6 73.75   255 205 178 635.5
  29. 16384    31 132.38 1.63  7.15 46.75 .   136  67.5 1.05 247.65 73.75   255 205 178 625.5
  30. 16385    31 132.38 1.63  7.15 45.75 . 135.5  67.5 1.05  252.6 73.75   255 205 178   623
  31. 16386    31 132.38 1.63  7.15 45.75 . 135.5    68 1.05  252.6 73.75 257.5 205 178 639.5
  32. 16387    31 132.38 1.63  7.15    47 . 135.5    68 1.05  252.6 73.75 257.5 205 178 643.5
  33. 16390  30.5 132.38 1.63  7.15    48 . 135.5    68 1.05  252.6 73.75   260 205 178 643.5
  34. 16391  30.5 132.38 1.63  7.94 47.25 . 135.5  68.5 1.05  252.6 73.75   260 205 178 643.5
  35. 16392  30.5 132.38 1.63  9.13    46 . 135.5  68.5 1.05  252.6 73.75   260 205 178 643.5
  36. 16393  30.5 132.38 1.63  8.74    45 . 135.5 68.25 1.05  252.6 73.75   260 205 178 643.5
  37. 16394  30.5 132.38 1.63  8.54  44.5 . 135.5    66 1.05  252.6 73.75   260 205 178 643.5
  38. 16397  30.5 132.38 1.63  7.94 44.25 . 135.5 64.25 1.05 262.51 73.75   260 205 178 643.5
  39. 16398  30.5 132.38 1.63  7.94 43.25 . 135.5  64.5 1.05 272.41 73.75 247.5 205 178 643.5
  40. 16399  30.5 132.38 1.63  8.14 42.75 . 135.5    65 1.05 272.41 73.75 247.5 205 178 643.5
  41. 16400  30.5 132.38 1.63  8.54 42.75 . 141.5    65 1.05 272.41 73.75   244 205 178 643.5
  42. 16401  30.5 132.38 1.63  8.54  42.5 .   145    66 1.05 262.51 73.75 242.5 205 178 643.5
  43. 16404    30 132.38 1.63  8.74  42.5 .   148 67.25 1.05 257.56 73.75 242.5 205 178 643.5
  44. 16405    30 132.38 1.63  8.34 40.25 . 143.5 67.75 1.05 255.08 73.75   240 205 178 643.5
  45. 16406  31.5 132.38 1.63  8.14    38 . 143.5 67.75 1.05  252.6 73.75   240 205 178 643.5
  46. 16407  31.5 132.38 1.63  8.54    38 . 147.5 67.75 1.05  252.6 73.75   240 205 178 643.5
  47. 16408  31.5 132.38 1.63  8.34  38.5 . 147.5 67.25 1.05 245.17 73.75   240 205 178 643.5
  48. 16411  33.5 132.38 1.63  8.34    41 . 149.5 67.25 1.05 237.74 73.75 227.5 205 178 643.5
  49. 16412    32 132.38 1.63  8.34    42 . 148.5 67.25 1.05 247.65 73.75 227.5 205 178 643.5
  50. 16413 31.75 132.38 1.63  8.34 40.25 . 146.5    66 1.05  252.6 73.75   220 205 178 643.5
  51. 16414  30.5 132.38 1.63  8.34    40 .   150    66 1.05 257.56 73.75   220 205 178 643.5
  52. 16415  33.5 132.38 1.63  8.34    40 . 155.5    66 1.05 257.56 73.75   220 205 178 643.5
  53. 16418  33.5 132.38 1.63  8.14    40 . 155.5    66 1.05 257.56 73.75   220 205 178 643.5
  54. 16419    31 132.38 1.63  8.14    40 .   165    66 1.05 257.56 73.75   220 205 178 643.5
  55. 16420    31 132.38 1.63  8.14    40 . 168.5    65 1.05 257.56 73.75   220 205 178 643.5
  56. 16421 31.25 132.38 1.63  8.54    40 . 170.5    65 1.05 257.56 73.75   219 205 178 643.5
  57. 16422  31.5 132.38 1.63  9.13 40.25 . 171.5    65 1.05 257.56 73.75   219 205 178 643.5
  58. 16425    31 132.38 1.63  9.13    40 . 173.5  65.5 1.05 257.56 73.75   219 205 178 643.5
  59. 16426    31 132.38 1.63  9.13 39.75 .   174  65.5 1.05 257.56 73.75   220 205 178 643.5
  60. 16427    31 132.38 1.63  8.74 39.75 .   175    66 1.05 257.56 73.75 222.5 205 178 643.5
  61. 16428    31 132.38 1.63  8.74 39.75 .   183    66 1.05 257.56 73.75   224 205 178 643.5
  62. 16429    31 132.38 1.63  8.74 39.75 .   181    66 1.05 262.51 73.75   224 205 178 643.5
  63. 16432    31 132.38 1.63  8.74 39.75 .   181    66 1.05 262.51 73.75   224 205 178 643.5
  64. 16433    31 132.38 1.63  8.74 39.75 .   181    66 1.05 262.51 73.75   224 205 178 643.5
  65. 16434    31 132.38 1.63  9.13 40.25 . 182.5    66 1.05 262.51 73.75   224 205 178 643.5
  66. 16435    31 132.38 1.63 10.13 40.25 . 191.5    66 1.05 262.51 73.75   224 205 178 643.5
  67. 16436    31 132.38 1.63 10.92  40.5 . 190.5    65 1.05 262.51 73.75 225.5 205 178 643.5
  68. 16439    31 132.38 1.63 10.92  40.5 . 190.5    65 1.05 262.51 73.75 225.5 205 178 643.5
  69. 16440    31 132.38 1.63 10.72 40.75 . 188.5    65 1.05 262.51 73.75 226.5 205 178 643.5
  70. 16441    31 132.38 1.63 10.52 40.75 . 186.5    66 1.05 262.51 73.75 226.5 205 178 643.5
  71. 16442    31 132.38 1.63 10.52    40 . 184.5    66 1.05 262.51 73.75 226.5 205 178 643.5
  72. 16443  31.5 132.38 1.63 10.72    40 . 184.5    66 1.05 262.51 73.75 226.5 205 178 643.5
  73. 16446 35.25 132.38 1.63 10.52    40 . 187.5 66.75 1.05 267.46 73.75 226.5 205 178 643.5
  74. 16447  34.5 132.38 1.63 10.52 39.75 . 187.5 67.25 1.05 267.46 73.75 226.5 205 178 643.5
  75. 16448    34 132.38 1.63 10.52    40 .   195 67.25 1.05 267.46 73.75 226.5 205 178 643.5
  76. 16449    35 132.38 1.63 10.52 39.75 . 189.5 67.25 1.05 267.46 73.75 225.5 205 178 643.5
  77. 16450  37.5 132.38 1.63 10.32  39.5 . 189.5 67.25 1.05 267.46 73.75 237.5 205 178 643.5
  78. 16453 38.75 132.38 1.63 10.32  39.5 .   195    67 1.05 267.46 73.75 237.5 205 178 643.5
  79. 16454 38.75 132.38 1.63  9.53 39.75 . 192.5    67 1.05 267.46 73.75   241 205 178 643.5
  80. 16455  37.5 132.38 1.63  9.53 39.75 .   191  66.5 1.05 267.46 73.75   241 205 178 643.5
  81. 16456  37.5 132.38 1.63  9.93 39.75 . 192.5  66.5 1.05 267.46 73.75 238.5 205 178 643.5
  82. 16457  37.5 132.38 1.63  9.73 39.75 . 192.5  66.5 1.05 267.46 73.75 237.5 205 178 643.5
  83. 16460    39 132.38 1.63  9.93 39.75 .   198  66.5 1.05 267.46 73.75   236 205 178 643.5
  84. 16461  38.5 132.38 1.63  9.73 40.75 .   211  66.5 1.05 267.46 73.75   236 205 178 643.5
  85. 16462  38.5 132.38 1.63  9.73 40.75 . 218.5    67 1.05 267.46 73.75   236 205 178 643.5
  86. 16463 36.75 132.38 1.63  9.13  42.5 .   215    67 1.05 272.41 73.75   245 205 178 643.5
  87. 16464  36.5 132.38 1.63  9.13  42.5 . 214.5    67 1.05 272.41 73.75   248 205 178 643.5
  88. 16467    37 132.38 1.63  8.34 41.75 .   210  66.5 1.05 277.37 73.75 251.5 205 178 643.5
  89. 16468  37.5 132.38 1.63  8.93 41.75 . 216.5    71 1.05 302.13 73.75   255 205 178 643.5
  90. 16469  37.5 132.38 1.63  8.93  41.5 .   214    75 1.05 312.04 73.75   255 205 178 643.5
  91. 16470  37.5 132.38 1.63  8.14 47.75 . 213.5  73.5 1.05 312.04 73.75   256 205 178 643.5
  92. 16471  37.5 132.38 1.63  8.54  47.5 . 214.5    73 1.05 302.13 73.75 256.5 205 178 643.5
  93. 16474  37.5 132.38 1.63  7.94    48 . 212.5    73 1.05 302.13 73.75 257.5 205 178 643.5
  94. 16475    38 132.38 1.63  7.74    52 . 207.5    73 1.05 304.61 73.75 257.5 205 178 643.5
  95. 16476    38 132.38 1.63  7.74  51.5 .   214 73.75 1.05 304.61 73.75 256.5 205 178 643.5
  96. 16477  37.5 132.38 1.63  7.74 50.25 .   220  73.5 1.05 304.61 73.75   255 205 178 643.5
  97. 16478  37.5 132.38 1.63  7.74 51.25 .   222  73.5 1.05 304.61 73.75   255 205 178 643.5
  98. 16481  37.5 132.38 1.63  7.74    51 . 222.5  73.5 1.05 304.61 73.75 253.5 205 178 643.5
  99. 16482  37.5 132.38 1.63  7.74    48 . 221.5    73 1.05 304.61 73.75 252.5 205 178 643.5
  100. 16483  37.5 132.38 1.63  7.74    47 . 222.5    73 1.05 304.61 73.75 252.5 205 178 643.5
  101. 16484    39 132.38 1.63  7.74  47.5 . 222.5    73 1.05 297.18 73.75 252.5 205 178 643.5
  102. 16485  40.5 132.38 1.63  7.94    48 . 218.5  72.5 1.05 297.18 73.75 252.5 205 178 643.5
  103. 16488 40.25 132.38 1.63  7.94 46.25 . 222.5  71.5 1.05 297.18 73.75 252.5 205 178 643.5
  104. end
  105. format %td date1
复制代码




stata SPSS
Jykaner 发表于 2018-3-16 18:41:59 |显示全部楼层
本帖最后由 Jykaner 于 2018-3-17 17:42 编辑

我自己检查了数据,感觉第二个点是没法解决的,因为就算观察值相同可能还是又一部分数据可以用,还是应该从数据库着手重新下载另一个类型的数据。
第一点通过excel计算std.dev.,找到值为0的也能删除。不过如果老师看到这个问题的话,希望能告知stata的解决方案,非常感谢。
最后一点问题,如果想针对每个单个日期排序,整个样本的7000+变量,找出每天的前80和末80并且标记,需要用到什么样的命令呢,这方面的知识在初级或者高级里面会有涉及到吗?
希望老师看到能够回答,非常感谢!
回复

使用道具 举报

Jykaner 发表于 2018-3-19 19:05:21 |显示全部楼层
连老师好,之前的问题已经解决,遇到新的问题如下,希望能得到您的帮助。
1.需要每天对变量进行排序,前三的标记为1,末三的标记为-1,都不是的为0
2.每个变量对应三个月度dummy variable,分别是上个月至少一次被标记为1从未被标记为-1的W=1,上个月至少一次被标记为-1从未被标记为1的L=1,上个月既标记为1又标记为-1的WL=1

我实际的数据有200多个月,而且不一定每个月的第一天为1号,命令要怎么写呢?

  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(date1 re_c966 re_c967 re_c968 re_c969 re_c970 re_c971 re_c972 re_c973 re_c974 re_c975 re_c976 re_c977 re_c978)
  4. 17471  .9787234042553191                  1  .9750130626259611  .9814814814814815                  1                  1 .9848484848484849                  1  .9842257985230946                  .                  1 . 1.0083543018584735
  5. 17472  .9951690821256038               .975 1.0070623361212654                  1                  1                  1                 1                  1   1.00764824056922                  .                  1 . 1.0260336292031942
  6. 17475   .970873786407767  .9846153846153847  .9920939602417425  .9716981132075472                  1                  1 .9846153846153847  .9810290387701227  .9906010379176546                  .                  1 .  .9290649011708736
  7. 17476             1.0225  .9791666666666666  .9849622619822995                  1                  1                  1                 1                  1 1.0200740829250807                  .                  1 .  .9857248376343799
  8. 17477  .9853300733496333 1.0585106382978724 1.0062819689985802  .9902912621359223                  1                  1           .984375                  1    .97781714888134                  .                  1 .  .9748100464740666
  9. 17478 1.0173697270471465  .9798994974874372  .9830498647081563  .9607843137254902                  1                  1                 1  .9935364727608496  .9985362603135622                  .                  1 .  1.005814995519267
  10. 17479  .9975609756097561                  1  .9927255568881113  .9489795918367348                  1                  1 .9841269841269841  .9675252257036643  .9985341146389836                  .                  1 .  .9768784524917339
  11. 17482   .980440097799511  .9897435897435898  .9881171647555107   .946236559139785                  1 1.0227272727272727 .9838709677419355  .9463183028240525  .9963280293757649                  .                  1 . 1.0624574374939195
  12. 17483 1.0099750623441397                  1   1.01388972400938  .9886363636363637                  1                  1                 1 1.0354688089092545  1.002581359943323                  .                  1 . 1.0105225406708787
  13. 17484  1.002469135802469  1.005181347150259                  1 1.0344827586206897 1.1176359872012045                  1                 1  .9657461348868474 1.0191017444155024                  .                  1 . 1.0085705008646013
  14. 17485  .9852216748768473                  1  .9863005574664927  .9833333333333333                  1                  1 .9344262295081968  .9929236391055945  .9974772342520774                  .  .9680020478689364 .  .9744994983753349
  15. 17486                  1 1.0515463917525774  .9935061030605495                  1                  1                  1                 1  .9928439991821714 1.0072287731052665                  .  .9916699722332408 .  .9968846035648434
  16. 17489                .97  .9803921568627451  .9972160019366944  .9717514124293786                  1                  1                 1  .9568427865380089  .9795486083068407                  .  .9583999999999999 .  .9943778443136846
  17. 17490  .9639175257731959               .975  .9953268192025248  .9418604651162791                  1                  1 .9298245614035088  .8947271329746349 1.0010980733123211                  . 1.0434056761268782 .                  1
  18. 17491  .9518716577540107  .9333333333333334  .9718292682926829                  1                  1                  1 .8679245283018868   .991581045324903  .9732895584073315                  .                  1 .  .9302305754698702
  19. 17492  .9775280898876404  .9725274725274725 1.0038691596603506 1.0617283950617284                  1                  1                 1 1.0254366509564734 1.0097734904169025                  .                  1 . 1.0141889471184689
  20. 17493                  1 1.0451977401129944  1.000958353299027 1.0406976744186047  .8947457056247895                  1                 1                  1 1.0178722431722087                  .  .9583999999999999 . 1.0106591853835662
  21. 17496 1.0028735632183907  .9945945945945947  .9807680299719014                  1                  1                  1 .9782608695652174 1.0165258533288275 1.0091422113448745                  .                  1 .  .9828609981019888
  22. 17497  .9914040114613181                  1 1.0009762101822968                  1                  1                  1                 1  .9593404036038432  .9894906643427956                  .                  1 . 1.0006698920729438
  23. 17498  .9942196531791907                  1                  1                  1                  1                  1                 1 1.0169808705295258  1.032964685512553           1.040625                  1 .  .9912889682303547
  24. 17499  1.005813953488372  .9891304347826087  1.008819725655649                  1                  1                  1                 1 1.0083145914264295 1.0070929190536486   .993993993993994                  1 .  .9939137249670673
  25. 17500 1.0173410404624277   .967032967032967  .9611626000882669                  1                  1                  1                 1 1.0082798242649544 1.0176056084328233 1.0030211480362539                  1 . 1.0272120256350032
  26. 17503  .9857954545454546  .9772727272727273 1.0474691155570133                  1  .8823640127987954                  1                 1  1.032780291603821 1.0017311634197026  .9759036144578314                  1 .  .9662246031227544
  27. 17504  .9769452449567724                  1  .9315325846449296                  1                  1  .9777777777777778                 1  1.238081329309058  .9972363389619662  .9938271604938271 1.0434056761268782 .  .9849222447599728
  28. 17505 1.0235988200589972  .9941860465116279  .9896472908170125  .9776536312849162                  1  .9772727272727273                 1  1.076935175233951 1.0259766953957812 1.0062111801242235 1.0417333333333332 . 1.0215727328894078
  29. end
  30. format %td date1
  31. format %6.5f re_c966-re_c978
复制代码

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-9-22 14:07