楼主: sihonglu
8802 12

[数据管理求助] 如何将两列字符串变量 按相同的部分字符匹配 [推广有奖]

  • 1关注
  • 0粉丝

等待验证会员

大专生

86%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0.0002
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
271 点
帖子
28
精华
0
在线时间
106 小时
注册时间
2015-6-14
最后登录
2020-8-13

楼主
sihonglu 发表于 2018-12-27 17:12:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教大神,有两列字符串格式的变量,其中一部分观察值的有几个字相同,我想实现的是,将具有相同字符的匹配或对应地排序起来,摸索了半天,没想找如何弄,matchit也没弄成果。请教各位大神,谢谢!数据如下:
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str30 countymaster str64 countyusing
  4. "阿城区"          "阿拉山口市(2012年设立)"                              
  5. "阿拉尔市"       "安塞县"                                                      
  6. "阿拉山口市"    "安县"                                                         
  7. "爱民区"          "白山市江源区(2006年前为江源县)"                  
  8. "安塞区"          "宝坻区"                                                      
  9. "安源区"          "宝鸡市陈仓区(2003年设立)"                           
  10. "安州区"          "宝鸡县(2003年撤销)"                                    
  11. "鞍山市铁西区" "保定市北市区"                                             
  12. "昂昂溪区"       "保定市南市区"                                             
  13. "八公山区"       "保定市新市区"                                             
  14. "巴南区"          "保山市"                                                      
  15. "巴宜区"          "北镇市(2006年前为北宁市)"                           
  16. "鲅鱼圈区"       "毕节市(2011年前为毕节地区)"                        
  17. "白塔区"          "毕节市(县级,2011年撤销)"                           
  18. "白银区"          "毕节市七星关区(2011年设立)"                        
  19. "白云鄂博矿区" "璧山县"                                                      
  20. "白云区"          "苍山县"                                                      
  21. "蚌山区"          "昌都县"                                                      
  22. "包河区"          "巢湖市(2011年调整为县级市,划归合肥市代管)"
  23. "包头市青山区" "潮安县"                                                      
  24. end
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:保定市南市区 包头市青山区 鞍山市铁西区 阿拉山口 鲅鱼圈区

回帖推荐

黃河泉 发表于6楼  查看完整内容

我还是看不懂!更重要的是,你的资料似乎没有规律!

沙发
黃河泉 在职认证  发表于 2018-12-27 17:20:41
看不懂你要做什么?有何规则?

藤椅
sihonglu 发表于 2018-12-27 17:31:27
黃河泉 发表于 2018-12-27 17:20
看不懂你要做什么?有何规则?
黄老师您好,谢谢您回复。在我列举的数据例子里,就是想把06行countymaser 中的“阿拉山口市”与04行 countyusing 中的 "阿拉山口市(2012年设立)" 匹配起来;再如下面左侧列中的"安塞区" 和右侧列的“安塞县”。请您帮忙看看,可以吗?

板凳
黃河泉 在职认证  发表于 2018-12-27 17:43:52
sihonglu 发表于 2018-12-27 17:31
黄老师您好,谢谢您回复。在我列举的数据例子里,就是想把06行countymaser 中的“阿拉山口市”与04行 cou ...
哪来的 06行与 04行?什么叫做匹配起来?请提供例子与解答!看起来是应该没办法!

报纸
sihonglu 发表于 2018-12-27 17:57:15
黃河泉 发表于 2018-12-27 17:43
哪来的 06行与 04行?什么叫做匹配起来?请提供例子与解答!看起来是应该没办法!
不好意思老师,是我表述的不清楚。重新放一个更清晰的例子吧,请看:
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str18 county1 str46 county2
  4. "阿拉尔市"    "阿拉山口市(2012年设立)"
  5. "阿拉山口市" "安塞县"                        
  6. "爱民区"       ""                                 
  7. "安塞区"       ""                                 
  8. ""                ""                                 
  9. end
复制代码
问题是:如何将county1 与county2 中具有相同字符的匹配,如 "阿拉山口市"与 "阿拉山口市(2012年设立)";"安塞区"与 "安塞县" ,不知道程序这么实现。麻烦老师了。谢谢您。

地板
黃河泉 在职认证  发表于 2018-12-27 17:59:08
sihonglu 发表于 2018-12-27 17:57
不好意思老师,是我表述的不清楚。重新放一个更清晰的例子吧,请看:问题是:如何将county1 与county2 中 ...
我还是看不懂!更重要的是,你的资料似乎没有规律!

7
sihonglu 发表于 2018-12-27 21:01:37
黃河泉 发表于 2018-12-27 17:59
我还是看不懂!更重要的是,你的资料似乎没有规律!
哦哦,谢谢老师,我再想想。

8
wyj125589720 学生认证  发表于 2019-5-8 16:38:34
你好,请问这个问题解决了吗?
我在做数据处理时也碰见了这样的问题,
如果已经解决,想请教您解决的办法。

9
KateFun 发表于 2019-12-20 11:15:28
wyj125589720 发表于 2019-5-8 16:38
你好,请问这个问题解决了吗?
我在做数据处理时也碰见了这样的问题,
如果已经解决,想请教您解决的办法 ...
请问您现在知道如何操作吗?我也需要相同的处理,想向您请教一下。

10
paul0212 发表于 2021-4-15 11:13:24
同求解决方案

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 08:58