楼主: 溜溜的鹿
1401 7

[面板数据求助] 重复数据的删除 [推广有奖]

  • 0关注
  • 0粉丝

已卖:34份资源

本科生

52%

还不是VIP/贵宾

-

威望
0
论坛币
223 个
通用积分
28.5515
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1301 点
帖子
55
精华
0
在线时间
93 小时
注册时间
2017-4-8
最后登录
2024-4-1

楼主
溜溜的鹿 发表于 2017-9-24 20:52:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
下面的数据是有两份数据A,B合并后的数据,但是两份数据有一些样本不能完全合并,如果先保存数据A的样本,怎么编写程序。
本来我想在数据A多加一个变量表示数据来源,但是数据合并后,数据B也匹配了这样变量,还是不能区分。
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(id year) str60 Company int rank
  4. 503 1972 "CBS"                    14
  5. 503 1972 "CBS"                   102
  6. 503 1973 "CBS"                   102
  7. 503 1973 "CBS"                    14
  8. 503 1974 "CBS"                    14
  9. 503 1974 "CBS"                   105
  10. 503 1975 "CBS"                    19
  11. 503 1975 "CBS"                   111
  12. end
复制代码




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重复数 generated generate install company

沙发
黃河泉 在职认证  发表于 2017-9-25 06:43:00
请分别贴出 A, B 之部分资料!

藤椅
也是晴天 在职认证  学生认证  发表于 2017-9-26 08:27:34
以A为主表进行合并

板凳
溜溜的鹿 发表于 2017-9-28 11:24:11
黃河泉 发表于 2017-9-25 06:43
请分别贴出 A, B 之部分资料!
数据A,时间1955-2005年。
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(year id) str38 Company int rank double(Assets Profits)
  4. 2005 10 "ABM Industries" 659  842.5 30.5
  5. 2004 10 "ABM Industries" 631    796 90.5
  6. 1958 11 "ACF Industries" 143  196.5    9
  7. 1977 11 "ACF Industries" 301  726.3   34
  8. 1978 11 "ACF Industries" 302  788.8 35.9
  9. 1964 11 "ACF Industries" 244  255.4  7.8
  10. 1967 11 "ACF Industries" 240  328.7 24.9
  11. 1965 11 "ACF Industries" 221  272.6 13.3
  12. 1962 11 "ACF Industries" 223  172.1  3.2
  13. end
复制代码
数据B,时间1955-2013年
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(year id) str38 Company int rank double Profits
  4. 2011 141 "American Express"                 91   4057
  5. 2012 141 "American Express"                 95   4935
  6. 2001 141 "American Express"                 74   2810
  7. 2008 141 "American Express"                 75   4012
  8. 2002 142 "American Family Ins. Grp."       337  100.4
  9. 2003 142 "American Family Ins. Grp."       323   58.2
  10. 2001 142 "American Family Ins. Grp."       361  236.7
  11. 1998 142 "American Family Ins. Grp."       396  251.6
  12. 2004 142 "American Family Ins. Grp."       313  155.4
  13. end
复制代码
一个数据有变量Assets,一个数据没有,我合并时还发现了问题,就是两个数据共同有的年限里,合并后第二个数据也出现了Assets,原始数据是没有的,这个数字是stata自动添加的吗?
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(year id) str38 Company int rank double(Assets Profits)
  4. 1996 2399 "U.S. Bancorp"   433  31794.3    329
  5. 1996 2399 "U.S. Bancorp"   371    33874  568.1
  6. 1997 2399 "U.S. Bancorp"   355    36489  739.8
  7. 1997 2399 "U.S. Bancorp"   445  33260.4  478.9
  8. 1999 2399 "U.S. Bancorp"   215    76438 1327.4
  9. 1999 2399 "U.S. Bancorp"   427  38475.8  430.1
  10. 2000 2399 "U.S. Bancorp"   268  72787.8  875.3
  11. 2000 2399 "U.S. Bancorp"   212    81530 1506.5
  12. end
复制代码



报纸
黃河泉 在职认证  发表于 2017-9-28 11:48:41
溜溜的鹿 发表于 2017-9-28 11:24
数据A,时间1955-2005年。数据B,时间1955-2013年一个数据有变量Assets,一个数据没有,我合并时还发现了 ...
1. 你的三个档看来都没关系。2. 你的指令是啥?

地板
溜溜的鹿 发表于 2017-9-28 13:49:48
黃河泉 发表于 2017-9-28 11:48
1. 你的三个档看来都没关系。2. 你的指令是啥?
数据太多,只粘贴了一部分,所以看不出联系。其实就数据A是1955-2005年,数据B是1955-2015年,我想把他们合并在一起,看看1955-2005年重合的部分的数据是否有差别,那么有差别的部分,我怎么知道它们来自于哪一个数据集,我直接用的merge 1:1

7
溜溜的鹿 发表于 2017-9-28 13:51:27
也是晴天 发表于 2017-9-26 08:27
以A为主表进行合并
可以具体的说一下吗?use A.dta,clear  merge 1:1 id year using B.dta
就是以A为主吧?

8
黃河泉 在职认证  发表于 2017-9-28 15:47:48
溜溜的鹿 发表于 2017-9-28 13:49
数据太多,只粘贴了一部分,所以看不出联系。其实就数据A是1955-2005年,数据B是1955-2015年,我想把他们 ...
我还是看不懂你的问题,但我相信这应该很简单可以解决的!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 21:52