楼主: 模山范水
4445 14

[数据管理求助] 如何对两个数据表进行数据筛选 [推广有奖]

11
模山范水 发表于 2018-7-29 10:25:05
黃河泉 发表于 2018-7-29 10:20
应该是 merge m:1 或 merge 1:m (其实意思是一样的),但因为不知道你原先要利用什么变量 (uniquely ide ...
谢谢黄老师,j是国家代码,hs6是产品编码,我要剔除的是两个表中这两个变量同时相同的数据,表一和表二中这两个变量的组合都是唯一的,但是如果是单独的变量(j或者hs6),两个表是存在重复的。

12
黃河泉 在职认证  发表于 2018-7-29 11:14:15
模山范水 发表于 2018-7-29 10:25
谢谢黄老师,j是国家代码,hs6是产品编码,我要剔除的是两个表中这两个变量同时相同的数据,表一和表二中 ...
1. 大概应该是类似
  1. use "first.dta", clear
  2. merge 1:1 j hs6 using `second.dta', force
复制代码
2. 我看不懂你讲的"我要剔除的是两个表中这两个变量同时相同的数据"?

13
模山范水 发表于 2018-7-29 11:24:11
黃河泉 发表于 2018-7-29 11:14
1. 大概应该是类似2. 我看不懂你讲的"我要剔除的是两个表中这两个变量同时相同的数据"?
比如,表1中j=1且hs6=100000,如果表2中也存j=1且hs6=100000,则表1剔除这一单位的样本数据。

14
黃河泉 在职认证  发表于 2018-7-29 11:53:26
模山范水 发表于 2018-7-29 11:24
比如,表1中j=1且hs6=100000,如果表2中也存j=1且hs6=100000,则表1剔除这一单位的样本数据。
如果我没误解,那么合并后
  1. drop if _merge == 3
复制代码

15
模山范水 发表于 2018-7-29 12:00:07
黃河泉 发表于 2018-7-29 11:53
如果我没误解,那么合并后
谢谢黄老师~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 17:25