楼主: fujingchi
8738 5

[数据管理求助] STATA里如何取两列数据的交集? [推广有奖]

  • 0关注
  • 0粉丝

大专生

76%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
491 点
帖子
50
精华
0
在线时间
42 小时
注册时间
2014-7-23
最后登录
2015-8-31

楼主
fujingchi 发表于 2014-7-24 10:50:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
      本人是第一次用STATA,向各位请教一个问题。
      现有3列数据,数据类型是long,在3个文件里(当然我也可以把它们都复制到同一文件中)。随便举个例子,数据如:
      var1               var2              var3
      2342334        2342334       7823213
      2342244        2354632       4532213
      123454          54324           2342334
      54324                                 54324
      3245432
      233444
      每一列的长度都不一样,最长的一列有1000万个数据。我现在需要把3列里都有的数据找出来,也就是找出它们的交集,请问用STATA怎么实现?
      原本用EXCEL做事很容易的,但数据太多了,超出了EXCEL的处理范围,所以只能用STATA了。
      第一次发帖,还请各位高手赐教!   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 用excel EXCEL 第一次发帖 如何

沙发
wfldragon 发表于 2014-7-24 11:14:54
贴到一列然后duplicate命令标记,3的就是

藤椅
fujingchi 发表于 2014-7-24 13:42:52
wfldragon 发表于 2014-7-24 11:14
贴到一列然后duplicate命令标记,3的就是
能详细点吗?我是新手,谢谢啦!

板凳
sungmoo 发表于 2014-7-24 15:55:56
我现在需要把3列里都有的数据找出来,也就是找出它们的交集
loc n=_N
set ob `=3*_N'
replace var1=var2[_n-`n'] if _n>`n'&_n<=2*`n'
replace var1=var3[_n-2*`n'] if _n>2*`n'
duplicates drop var1, force

报纸
fujingchi 发表于 2014-7-24 16:24:52
已经搞定,谢谢各位

地板
1023715119 发表于 2016-3-23 21:21:19
fujingchi 发表于 2014-7-24 16:24
已经搞定,谢谢各位
楼主,请问是怎么搞定的呢?谢谢啦

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 01:25