楼主: huashao214
122036 49

[数据管理求助] repeated time values within panel   [推广有奖]

41
cora1992 学生认证  发表于 2020-1-6 09:36:47
黃河泉 发表于 2020-1-3 16:37
请试试
谢谢黄老师!找到重复值了!应该是两个数据库merge的时候产生的~
可是为什么duplicates list 这个命令找不到缺失值,duplicates list id year 可以找到呢?

42
黃河泉 在职认证  发表于 2020-1-6 11:04:48
cora1992 发表于 2020-1-6 09:36
谢谢黄老师!找到重复值了!应该是两个数据库merge的时候产生的~
可是为什么duplicates list 这个命令找 ...
1. 请 help duplicates。2. duplicates list id year 是根据  id year 来确认有无重复值。

43
cora1992 学生认证  发表于 2020-1-6 11:11:56
黃河泉 发表于 2020-1-6 11:04
1. 请 help duplicates。2. duplicates list id year 是根据  id year 来确认有无重复值。
好的好的,谢谢黄老师~

44
zhbxsd 学生认证  发表于 2020-2-23 07:41:52
黃河泉 发表于 2020-1-6 11:04
1. 请 help duplicates。2. duplicates list id year 是根据  id year 来确认有无重复值。
您好,是這樣的,我運行了duplicates report met2013 year 后
出現的結果很奇怪
duplicates report met2013 year
Duplicates in terms of met2013 year
--------------------------------------
   copies | observations       surplus
----------+---------------------------
      263 |          263           262
      272 |          272           271
      273 |          273           272
      277 |          277           276
      278 |          278           277
      281 |          281           280
      282 |          282           281
      284 |          284           283
      285 |          570           568
      286 |          286           285
      287 |          287           286
      291 |          582           580
      292 |          292           291
      295 |          295           294
      296 |          296           295
      297 |          594           592
      301 |          602           600
      302 |          604           602
      304 |          304           303
      306 |          612           610
      307 |          307           306
      308 |          616           614
。。。
後面大概有4w多個,幾乎都是surplus比 observations大1或2
這怎麼辦啊
我數據量很大,總共700w的觀測值
打開數據編輯器,也不知道咋修改 微信截图_20200223074018.png 微信截图_20200223074005.png

45
刘刘小源子 学生认证  发表于 2020-8-10 17:05:39
黃河泉 发表于 2020-1-6 11:04
1. 请 help duplicates。2. duplicates list id year 是根据  id year 来确认有无重复值。
黄老师您好,我使用了数据库数据样本无单一的id,其中hhid为每一个家庭的变量、pline为家庭中成员的标号,数据示例如下,势必会导致xtset有重复数据,请问这样应该怎样使用xtset命令呀,打扰您啦。
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input long hhid float pline int time
  4. 201100637 1 2015
  5. 201100637 1 2013
  6. 201100638 1 2013
  7. 201100638 1 2015
  8. 201100638 3 2013
  9. 201100638 3 2015
  10. 201100638 4 2015
  11. 201100638 4 2013
  12. 201100639 1 2015
  13. 201100639 1 2013
  14. 201100640 1 2015
  15. 201100640 1 2013
  16. 201100640 2 2013
  17. 201100640 2 2015
  18. 201100640 3 2013
  19. 201100640 3 2015
  20. 201100640 4 2015
  21. 201100640 4 2013
  22. 201100643 1 2015
  23. 201100643 1 2013
  24. 201100643 2 2015
  25. 201100643 2 2013
  26. 201100643 3 2015
  27. 201100643 3 2013
  28. 201100646 1 2013
  29. 201100646 1 2015
  30. 201100646 2 2015
  31. 201100646 2 2013
  32. 201100647 1 2015
  33. 201100647 1 2013
  34. 201100647 3 2013
  35. 201100647 3 2015
  36. 201100647 4 2015
  37. 201100647 4 2013
  38. 201100647 5 2013
  39. 201100647 5 2015
  40. 201100648 1 2015
  41. 201100648 1 2013
  42. 201100648 3 2015
  43. 201100648 3 2013
  44. 201100648 4 2015
  45. 201100648 4 2013
  46. 201100648 5 2013
  47. 201100648 5 2015
  48. 201100649 1 2013
  49. 201100649 1 2015
  50. 201100649 2 2015
  51. 201100649 2 2013
  52. 201100649 3 2013
  53. 201100649 3 2015
  54. 201100649 4 2013
  55. 201100649 4 2015
  56. 201100649 5 2015
  57. 201100649 5 2013
  58. 201100651 1 2015
  59. 201100651 1 2013
  60. 201100652 1 2013
  61. 201100652 1 2015
  62. 201100652 2 2013
  63. 201100652 2 2015
  64. 201100653 1 2013
  65. 201100653 1 2015
  66. 201100654 1 2015
  67. 201100654 1 2013
  68. 201100654 2 2013
  69. 201100654 2 2015
  70. 201100655 1 2015
  71. 201100655 1 2013
  72. 201100655 2 2015
  73. 201100655 2 2013
  74. 201100655 3 2015
  75. 201100655 3 2013
  76. 201100656 1 2015
  77. 201100656 1 2013
  78. 201100656 2 2013
  79. 201100656 2 2015
  80. 201100656 3 2015
  81. 201100656 3 2013
  82. 201100656 4 2015
  83. 201100656 4 2013
  84. 201100657 1 2015
  85. 201100657 1 2013
  86. 201100657 2 2015
  87. 201100657 2 2013
  88. 201100657 3 2013
  89. 201100657 3 2015
  90. 201100657 4 2015
  91. 201100657 4 2013
  92. 201100657 5 2013
  93. 201100657 5 2015
  94. 201100658 1 2015
  95. 201100658 1 2013
  96. 201100658 2 2013
  97. 201100658 2 2015
  98. 201100661 2 2015
  99. 201100661 2 2013
  100. 201100661 3 2013
  101. 201100661 3 2015
  102. 201100661 4 2013
  103. 201100661 4 2015
  104. end
  105. label values time partCode
复制代码

46
黃河泉 在职认证  发表于 2020-8-10 17:22:03
刘刘小源子 发表于 2020-8-10 17:05
黄老师您好,我使用了数据库数据样本无单一的id,其中hhid为每一个家庭的变量、pline为家庭中成员的标号, ...
问题可能没你想的简单,怎么设定,取决于你分析的个体/单位 (你没提到)。一种可能性为
  1. egen id = group(hhid pline)
  2. xtset id time
复制代码
但我不知道这是不是你要的情况!

47
刘刘小源子 学生认证  发表于 2020-8-10 17:29:16
黃河泉 发表于 2020-8-10 17:22
问题可能没你想的简单,怎么设定,取决于你分析的个体/单位 (你没提到)。一种可能性为但我不知道这是不是 ...
您对stata的运用和对数据的理解太厉害了!这确实解决了我的问题!我的分析个体是个人数据,也只是我目前能想到的解决方案了,希望接下来的步骤中不会再出现新的问题~

48
shuuenn 发表于 2021-6-29 23:27:51
因书而乐 发表于 2014-11-17 16:43
输入isid stkcd year
显示variables stkcd year do not uniquely identify the observations
duplicates report id year
duplicates list id year
duplicates tag id year, gen(isdup)
edit if isdup
drop if isdup==1

49
是珊珊呀ss 发表于 2021-12-22 22:10:33
本人计量小白,出现了和楼主同样的情况,设置面板数据时出现r(451)错误,仔细检查个体变量名称的设置,发现出现了个体变量名称重复的情况,才导致的这个错误。
我的数据是地级市,比如台州和泰州,首字母都是tz,所以在设置变量时重复了没有发现,导致数据导入stata之后出现错误
希望能对大家有帮助

50
沐宇M 发表于 2022-4-28 21:19:51
因书而乐 发表于 2014-11-17 16:43
输入isid stkcd year
显示variables stkcd year do not uniquely identify the observations
解决了么姐妹求助啊

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 06:31