楼主: fujingchi
8122 5

[数据管理求助] STATA里如何取两列数据的交集? [推广有奖]

  • 0关注
  • 0粉丝

大专生

76%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
491 点
帖子
50
精华
0
在线时间
42 小时
注册时间
2014-7-23
最后登录
2015-8-31

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
      本人是第一次用STATA,向各位请教一个问题。
      现有3列数据,数据类型是long,在3个文件里(当然我也可以把它们都复制到同一文件中)。随便举个例子,数据如:
      var1               var2              var3
      2342334        2342334       7823213
      2342244        2354632       4532213
      123454          54324           2342334
      54324                                 54324
      3245432
      233444
      每一列的长度都不一样,最长的一列有1000万个数据。我现在需要把3列里都有的数据找出来,也就是找出它们的交集,请问用STATA怎么实现?
      原本用EXCEL做事很容易的,但数据太多了,超出了EXCEL的处理范围,所以只能用STATA了。
      第一次发帖,还请各位高手赐教!   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 用excel EXCEL 第一次发帖 如何

沙发
wfldragon 发表于 2014-7-24 11:14:54 |只看作者 |坛友微信交流群
贴到一列然后duplicate命令标记,3的就是

使用道具

藤椅
fujingchi 发表于 2014-7-24 13:42:52 |只看作者 |坛友微信交流群
wfldragon 发表于 2014-7-24 11:14
贴到一列然后duplicate命令标记,3的就是
能详细点吗?我是新手,谢谢啦!

使用道具

板凳
sungmoo 发表于 2014-7-24 15:55:56 |只看作者 |坛友微信交流群
我现在需要把3列里都有的数据找出来,也就是找出它们的交集
loc n=_N
set ob `=3*_N'
replace var1=var2[_n-`n'] if _n>`n'&_n<=2*`n'
replace var1=var3[_n-2*`n'] if _n>2*`n'
duplicates drop var1, force

使用道具

报纸
fujingchi 发表于 2014-7-24 16:24:52 |只看作者 |坛友微信交流群
已经搞定,谢谢各位

使用道具

地板
1023715119 发表于 2016-3-23 21:21:19 |只看作者 |坛友微信交流群
fujingchi 发表于 2014-7-24 16:24
已经搞定,谢谢各位
楼主,请问是怎么搞定的呢?谢谢啦

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-26 01:55