- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 18 个
- 通用积分
- 0.5091
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 2964 点
- 帖子
- 117
- 精华
- 0
- 在线时间
- 180 小时
- 注册时间
- 2015-2-4
- 最后登录
- 2022-1-8
已卖:240份资源
硕士生
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
 - 18 个
- 通用积分
- 0.5091
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 2964 点
- 帖子
- 117
- 精华
- 0
- 在线时间
- 180 小时
- 注册时间
- 2015-2-4
- 最后登录
- 2022-1-8
 | 难过 2016-11-21 22:54:05 |
|---|
签到天数: 20 天 连续签到: 1 天 [LV.4]偶尔看看III
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
stata在合并数据量较多的数据时每次合并后的观测值会有小幅度的变化这是为什么 - ********************************************************************************
- *(1)电话号码后七位和行政区划
- ********************************************************************************
- cd E:\paper\data\2000
- use F2000.dta, clear
- sort dhhm xzqh
- save F2000.dta, replace
- use C2000c.dta, clear
- sort dhhm xzqh
- save C2000c.dta, replace
- merge m:1 dhhm xzqh using F2000.dta
- keep if _merge == 3
- drop _merge
- save CF1.dta, replace
- use CF1.dta, clear
- duplicates drop qymc, force
- use CF1.dta, clear
- duplicates drop country, force
- *****注释: 41304条记录 7317个企业 186个国家
- **********************************************
- ********************************************************************************
- *(2)按企业名称合并
- ********************************************************************************
- use F2000.dta, clear
- sort qymc
- save F2000.dta, replace
- use C2000c.dta, clear
- sort qymc
- save C2000c.dta, replace
- merge m:1 qymc using F2000.dta
- keep if _merge == 3
- drop _merge
- save CF2.dta, replace
- use CF2.dta, clear
- duplicates drop qymc, force
- use CF2.dta, clear
- duplicates drop country, force
- *****注释:87370条记录 14488个企业 195个国家
- **********************************************
- ********************************************************************************
- *(3)按电话号码后七位和法人姓名合并
- ********************************************************************************
- use F2000.dta, clear
- sort dhhm fr
- save F2000.dta, replace
- use C2000c.dta, clear
- sort dhhm fr
- save C2000c.dta, replace
- merge m:1 dhhm fr using F2000.dta
- keep if _merge == 3
- drop _merge
- save CF3.dta, replace
- use CF3.dta, clear
- duplicates drop qymc, force
- use CF3.dta, clear
- duplicates drop country, force
- *****注释: 4237条记录 703个企业 13个国家
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|