楼主: 日新少年
965 6

[数据管理求助] 求助数据匹配与识别 [推广有奖]

区版主

已卖:26526份资源

大师

46%

还不是VIP/贵宾

-

TA的文库  其他...

日新文库:Matlab入门及进阶

日新文库:Stata入门及进阶

日新文库:R入门及进阶

威望
3
论坛币
646393 个
通用积分
22788.5150
学术水平
1190 点
热心指数
1369 点
信用等级
1056 点
经验
219922 点
帖子
11024
精华
11
在线时间
6842 小时
注册时间
2010-4-15
最后登录
2025-12-28

初级热心勋章 初级学术勋章 初级信用勋章 中级热心勋章 中级学术勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章

楼主
日新少年 学生认证  发表于 2019-7-23 09:28:27 |AI写论文
1000论坛币
微信截图_20190723092310.png
我想看一下,同一省,省级与市级官员任期重合年份,籍贯信息的匹配情况,,比如在某一省内,某地市级官员在2001年与某省级官员籍贯信息相同,,,求助怎么识别?我把样本数据上传上来,求大家帮忙,相关变量样本数据里都有,谢谢大家!!



省级数据2019年7月22日.dta (47.97 KB)

市级数据2019年7月22日.dta (205.5 KB)





关键词:数据匹配 求大家帮忙 样本数据 样本数

沙发
yangyuzhou 发表于 2019-7-23 09:28:28
  1. use "省级数据2019年7月22日.dta", clear
  2. by id, sort:egen yrmax = max(wk_e)
  3. by id, sort:egen yrmin = min(wk_s)
  4. keep id yrmax yrmin prvn
  5. duplicates drop
  6. rename id id1
  7. save province.dta, replace

  8. use "市级数据2019年7月22日.dta", clear
  9. by id, sort:egen yrmax2 = max(wk_e)
  10. by id, sort:egen yrmin2 = min(wk_s)
  11. keep id yrmax yrmin prvn
  12. duplicates drop

  13. joinby prvn using province.dta

  14. sort prvn
  15. drop if yrmin > yrmax2
  16. drop if yrmax < yrmin2

  17. gen min = yrmin if yrmin >= yrmin2
  18. replace min = yrmin2 if min == .

  19. gen max = yrmax if yrmax <= yrmax2
  20. replace max = yrmax2 if max == .

  21. keep id id1 max min prvn
复制代码

藤椅
heric221 在职认证  发表于 2019-7-23 11:00:04
我试了一下,你提供的样本里不存在“同一省,省级与市级官员任期重合年份”情形。

板凳
heric221 在职认证  发表于 2019-7-23 11:01:17
就两个人同时出现在省级和市级官员的数据里。

报纸
日新少年 学生认证  发表于 2019-7-23 14:49:21
heric221 发表于 2019-7-23 11:01
就两个人同时出现在省级和市级官员的数据里。
需要的不是同一个人出现在省级和市级数据里啊,,是要在对应时间段里的同一省的省级和市级官员的籍贯信息的对应状况。

地板
heric221 在职认证  发表于 2019-7-23 16:26:07
日新少年 发表于 2019-7-23 14:49
需要的不是同一个人出现在省级和市级数据里啊,,是要在对应时间段里的同一省的省级和市级官员的籍贯信息 ...
这样,你的问题解决了就好。

7
日新少年 学生认证  发表于 2019-7-23 17:32:31
heric221 发表于 2019-7-23 16:26
这样,你的问题解决了就好。
我最后选择把 年份,省份,籍贯三个变量 一起merge

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 22:14