楼主: Sylvia_szl
4758 14

[面板数据求助] stata如何将两年不同数据库合并且不自动覆盖被合并库中相同的变量 [推广有奖]

  • 0关注
  • 2粉丝

本科生

58%

还不是VIP/贵宾

-

威望
0
论坛币
35 个
通用积分
2.0313
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
165 点
帖子
19
精华
0
在线时间
181 小时
注册时间
2017-1-17
最后登录
2021-9-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问各位大神,以CFPS2016和2014年数据为例:2016年和2014年都包含的家庭有10077户,但是用merge合并后在2014年中的样本被覆盖掉了,keep _merge==3也只能保留16年和14年都有的样本。但我想知道如何在将两年数据合并到一起时,还能保持年份特征,就是10077户样本在2014年有数据,在2016年仍然有数据,而不是仅剩下2016年。
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(pid fid16 fid14 age) float year
  4. 100051502 100051 100051 50 2016
  5. 120009102 100160 100160 25 2016
  6. 130005103 100286 100286 38 2016
  7. 130167104 100531 130167 31 2016
  8. 130299106 100569 100569 71 2016
  9. 130517102 100782 130517 42 2016
  10. 130630103 100879 130630 26 2016
  11. 130681103 100920 130681 27 2016
  12. 130813104 101021 130813 32 2016
  13. 130815105 101023 130815 35 2016
  14. 130896107 101129 101129 26 2016
  15. 130897103 101130 101130 22 2016
  16. 140122105 101303 140122 18 2016
  17. 140519105 101581 140519 27 2016
  18. 140838103 101802 140838 25 2016
  19. 411737103 102161 189590 22 2016
  20. 210223103 102448 210223 24 2016
  21. 210547103 102666 210547 29 2016
  22. 210638104 102730 210638 29 2016
  23. 210727103 102783 210727 27 2016
  24. 210966105 102888 102888 37 2016
  25. 211093102 102992 102992 81 2016
  26. 211233103 103169 211233 38 2016
  27. 211584103 103465 211584 30 2016
  28. 211775101 103614 103614 58 2016
  29. 211934103 103766 103766 19 2016
  30. 103788501 103788 103788 29 2016
  31. 220098103 103924 103924 34 2016
  32. 220195103 103952 220195 33 2016
  33. 230016102 104182 230016 23 2016
  34. 230103103 104256 230103 25 2016
  35. 230624103 104690 230624 25 2016
  36. 310912103 105492 105492 36 2016
  37. 312144431 106335 106335 59 2016
  38. 211940104 106601 106601 59 2016
  39. 320111102 106605 320111 53 2016
  40. 320107104 106761 106761 26 2016
  41. 330067104 106867 330067 29 2016
  42. 330187104 106945 330187 26 2016
  43. 350005105 107388 350005 20 2016
  44. 340342104 107643 107643 30 2016
  45. 360172101 107684 360172 30 2016
  46. 370089102 107911 370089 51 2016
  47. 360278103 108165 108165 25 2016
  48. 360320103 108211 108211 27 2016
  49. 370115104 108244 108244 35 2016
  50. 108476551 108476     -8 31 2016
  51. 108660552 108660     -8 43 2016
  52. 410353105 108807 410353 27 2016
  53. 370611104 108908 108908 28 2016
  54. 370707104 108979 108979 37 2016
  55. 410046102 109137 109137 57 2016
  56. 410134104 109216 109216 29 2016
  57. 410881104 109250 410881 42 2016
  58. 410969103 109336 410969 34 2016
  59. 411010102 109372 411010 51 2016
  60. 411044105 109404 411044 25 2016
  61. 410426105 109508 109508 27 2016
  62. 410447104 109531 109531 19 2016
  63. 410695103 109783 109783 27 2016
  64. 410708104 109791 109791 29 2016
  65. 411631103 109849 411631 23 2016
  66. 411739104 109942 411739 28 2016
  67. 410865103 109949 109949 32 2016
  68. 411774104 109970 411774 39 2016
  69. 110003101 110003 110003 45 2016
  70. 110006101 110006 110006 56 2016
  71. 110009102 110009 110009 60 2016
  72. 110011101 110011 110011 43 2016
  73. 110015101 110015 110015 50 2016
  74. 110020101 110020 110020 71 2016
  75. 110021102 110021 110021 76 2016
  76. 110024102 110024 110024 80 2016
  77. 110026104 110026 110026 72 2016
  78. 110030431 110030 110030 68 2016
  79. 110033104 110033 110033 48 2016
  80. 110035101 110035 110035 64 2016
  81. 110038104 110038 110038 59 2016
  82. 110043103 110043 110043 31 2016
  83. 110047102 110047 110047 39 2016
  84. 110050101 110050 110050 85 2016
  85. 110051102 110051 110051 84 2016
  86. 110052101 110052 110052 56 2016
  87. 110057101 110057 110057 66 2016
  88. 110060102 110060 110060 66 2016
  89. 110061102 110061 110061 56 2016
  90. 110062101 110062 110062 58 2016
  91. 110066102 110066 110066 73 2016
  92. 110067101 110067 110067 30 2016
  93. 110069101 110069 110069 65 2016
  94. 110071101 110071 110071 66 2016
  95. 110072102 110072 110072 68 2016
  96. 110073101 110073 110073 83 2016
  97. 110074101 110074 110074 68 2016
  98. 110076101 110076 110076 56 2016
  99. 110078103 110078 110078 78 2016
  100. 110079102 110079 110079 44 2016
  101. 110081102 110081 110081 61 2016
  102. 110083103 110083 110083 38 2016
  103. 110084101 110084 110084 58 2016
  104. end
  105. label values pid pid
  106. label values fid16 fid16
  107. label values fid14 fid14
  108. label def fid14 -8 "不适用", modify
  109. label values age cfps_age
复制代码



  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(pid fid14 age) float year
  4. 110147102 100125 32 2014
  5. 120009102 100160 23 2014
  6. 130005103 100286 36 2014
  7. 430111103 100453 33 2014
  8. 130281103 100551 26 2014
  9. 130299106 100569 69 2014
  10. 130533103 100765 21 2014
  11. 130896107 101129 24 2014
  12. 130897103 101130 20 2014
  13. 140376103 101571 30 2014
  14. 140668105 101797 29 2014
  15. 210966105 102888 35 2014
  16. 211093102 102992 79 2014
  17. 211775101 103614 56 2014
  18. 211820103 103671 27 2014
  19. 211934103 103766 17 2014
  20. 211952103 103788 29 2014
  21. 220098103 103924 32 2014
  22. 230451103 104645 28 2014
  23. 310912103 105492 33 2014
  24. 312144106 106335 32 2014
  25. 312217102 106383 72 2014
  26. 312458103 106561 26 2014
  27. 211940103 106601 60 2014
  28. 312534103 106632 34 2014
  29. 320107104 106761 24 2014
  30. 330100103 107117 32 2014
  31. 340218103 107530 22 2014
  32. 340271103 107580 95 2014
  33. 340342104 107643 28 2014
  34. 360160104 108037 35 2014
  35. 360320103 108211 24 2014
  36. 370115104 108244 33 2014
  37. 370212103 108476 27 2014
  38. 370611104 108908 26 2014
  39. 410046102 109137 55 2014
  40. 410134104 109216 27 2014
  41. 410383103 109463 31 2014
  42. 410447104 109531 17 2014
  43. 410518103 109606 27 2014
  44. 410525103 109615 26 2014
  45. 410563102 109657 49 2014
  46. 410695103 109783 25 2014
  47. 410708104 109791 27 2014
  48. 410865103 109949 30 2014
  49. 110002102 110002 45 2014
  50. 110003101 110003 43 2014
  51. 110006101 110006 54 2014
  52. 110011101 110011 41 2014
  53. 110013101 110013 43 2014
  54. 110015101 110015 48 2014
  55. 110020102 110020 74 2014
  56. 110021101 110021 79 2014
  57. 110024102 110024 78 2014
  58. 110026104 110026 70 2014
  59. 110027101 110027 76 2014
  60. 110030431 110030 66 2014
  61. 110031101 110031 55 2014
  62. 110033104 110033 46 2014
  63. 110035101 110035 61 2014
  64. 110038101 110038 61 2014
  65. 110039101 110039 26 2014
  66. 110041102 110041 49 2014
  67. 110042101 110042 60 2014
  68. 110043101 110043 54 2014
  69. 110044101 110044 65 2014
  70. 110045101 110045 82 2014
  71. 110047102 110047 37 2014
  72. 110050101 110050 83 2014
  73. 110051102 110051 82 2014
  74. 110052101 110052 54 2014
  75. 110057102 110057 65 2014
  76. 110060102 110060 64 2014
  77. 110061102 110061 54 2014
  78. 110062101 110062 56 2014
  79. 110064532 110064 63 2014
  80. 110065102 110065 30 2014
  81. 110066102 110066 71 2014
  82. 110067101 110067 28 2014
  83. 110069101 110069 63 2014
  84. 110071101 110071 64 2014
  85. 110072101 110072 66 2014
  86. 110073101 110073 81 2014
  87. 110074102 110074 64 2014
  88. 110075103 110075 42 2014
  89. 110076101 110076 54 2014
  90. 110077101 110077 47 2014
  91. 110078103 110078 75 2014
  92. 110079101 110079 46 2014
  93. 110081102 110081 59 2014
  94. 110082101 110082 60 2014
  95. 110083103 110083 36 2014
  96. 110084101 110084 56 2014
  97. 110092104 110092 51 2014
  98. 110093101 110093 30 2014
  99. 110102531 110102 59 2014
  100. 110104101 110104 54 2014
  101. 110105101 110105 32 2014
  102. 110107101 110107 52 2014
  103. 110108101 110108 56 2014
  104. end
  105. label values pid pid
  106. label values fid14 fid14
  107. label values age cfps2014_age
复制代码




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 数据库 generated generate

沙发
黃河泉 在职认证  发表于 2019-12-27 08:33:42 |只看作者 |坛友微信交流群
看起来应该是用 (help) append 而不是 merge。

使用道具

藤椅
Sylvia_szl 学生认证  发表于 2019-12-27 10:07:12 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-12-27 08:33
看起来应该是用 (help) append 而不是 merge。
黄老师好!感谢老师回复,我用了append,但是append只是单纯把两年数据并到一起体现不出哪些数据是两年都有的,但是我需要先得出哪些数据是这两年都有的,然后把这些都有的数据再分为16年的和14年的。用merge的话虽然能得出两年都有的数据,但是16年的把14年的数据覆盖掉了,只剩下16年。
不知我的表述是否清晰,总之就是要先筛选出两年都包含的,然后将这两年都包含的数据做纵向合并

使用道具

板凳
黃河泉 在职认证  发表于 2019-12-27 10:47:08 |只看作者 |坛友微信交流群
Sylvia_szl 发表于 2019-12-27 10:07
黄老师好!感谢老师回复,我用了append,但是append只是单纯把两年数据并到一起体现不出哪些数据是两年都 ...
1. 可以先 append,再保留两年都有的资料!2. 不然在merge 之前,rename 某一档案之相关变量名字。

使用道具

报纸
Sylvia_szl 学生认证  发表于 2019-12-27 10:54:47 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-12-27 10:47
1. 可以先 append,再保留两年都有的资料!2. 不然在merge 之前,rename 某一档案之相关变量名字。
能不能麻烦黄老师讲的详细一点,如何保留两年都有的资料呢?
另外例如如果先rename 14年变量名,那么合并出来的数据是横向合并了,是增加了变量个数,但我初衷是纵向合并,不增加变量个数只增加观察值数量。stata能做吗?

使用道具

地板
黃河泉 在职认证  发表于 2019-12-27 11:04:25 |只看作者 |坛友微信交流群
Sylvia_szl 发表于 2019-12-27 10:54
能不能麻烦黄老师讲的详细一点,如何保留两年都有的资料呢?
另外例如如果先rename 14年变量名,那么合并 ...
你要保留的资料 (变量) 为谁? age?

使用道具

7
Sylvia_szl 学生认证  发表于 2019-12-27 11:23:56 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-12-27 11:04
你要保留的资料 (变量) 为谁? age?
还有好多其他变量都需要保留,上面例子是我从中选取的几个,不是全部。pid是个人编码,fid14、fid16是不同年份的家户号,age和year也是都需要保留的变量。所以在新生成的数据里面,这些都是需要保留的变量。在merge14和16年数据时,我是用的merge m:1 fid14,用家户号来匹配比用个人编码pid来匹配的好处是可能有些人离婚后再组成新的家庭,那么个人编码不变但家户号变了,避免产生误差,因为我是以家庭为单位来做的。

使用道具

8
Sylvia_szl 学生认证  发表于 2019-12-27 11:28:10 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-12-27 11:04
你要保留的资料 (变量) 为谁? age?
黄老师好!
pid、fid14、fid16、age、year都是我要保留的变量。其中pid为个人编码,fid14和fid16为14年与16年的家户号。用merge合并14年和16年数据时时我用的是merge m:1 fid14,因为如果用个人编码pid合并可能会因为某些个体离婚再结婚产生新的家户号fid而产生误差,所以用fid14来合并14年和16年数据。

使用道具

9
黃河泉 在职认证  发表于 2019-12-27 15:03:53 |只看作者 |坛友微信交流群
Sylvia_szl 发表于 2019-12-27 11:28
黄老师好!
pid、fid14、fid16、age、year都是我要保留的变量。其中pid为个人编码,fid14和fid16为14年与 ...
我已经无法理解你的问题了!

使用道具

10
Sylvia_szl 学生认证  发表于 2019-12-27 15:41:14 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-12-27 15:03
我已经无法理解你的问题了!
我可能之前表述太复杂。我用的是CFPS数据库。
简单来说就是变量名是统一的,包括个人ID、家庭ID、家庭收入信息、家庭负债情况等,在14和16年都有这些家庭信息。我想把14和16年共同存在的这些家庭找出来,这些共同存在的家庭在14年的收入信息负债状况怎么样,在16年又是怎么样。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 02:39