楼主: 董妞妞
17799 21

[字符问题求助] 如何分离公司地注册地的省份和城市(含dataex) [推广有奖]

  • 3关注
  • 2粉丝

大专生

56%

还不是VIP/贵宾

-

威望
0
论坛币
11 个
通用积分
0.0006
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1231 点
帖子
39
精华
0
在线时间
41 小时
注册时间
2017-12-26
最后登录
2021-3-20

楼主
董妞妞 发表于 2018-3-13 19:13:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
想请教大家 如何分离公司地注册地的省份和城市
以"安徽省芜湖市无为县" 为例,我希望生成两个变量
province=安徽 City=芜湖市

----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str63 Regplc
  4. "广东省深圳市"                     
  5. "广东省深圳市"                     
  6. "广东省深圳市"                     
  7. "广东省深圳市"                     
  8. "广东省深圳市"                     
  9. "广东省深圳市"                     
  10. "广东省深圳市"                     
  11. "广东省深圳市"                     
  12. "广东省深圳市"                     
  13. "广东省深圳市"                     
  14. "广东省深圳市"                     
  15. "广东省深圳市"                     
  16. "广东省深圳市"                     
  17. "广东省惠州市"                     
  18. "广东省惠州市"                     
  19. "北京市"                              
  20. "安徽省芜湖市无为县"            
  21. "湖南省洪江市"                     
  22. "湖南省长沙市"                     
  23. "河北省石家庄市"                  
  24. "新疆维吾尔自治区乌鲁木齐市"
  25. "江苏省苏州市"                     
  26. "广东省佛山市"                     
  27. "山东省潍坊市"                     
  28. "河南省许昌市"                     
  29. "河北省唐山市"                     
  30. "重庆市"                              
  31. "江西省景德镇市"                  
  32. "山东省东营市"                     
  33. "山东省济南市"                     
  34. "河北省邯郸市"                     
  35. "广东省深圳市"                     
  36. "浙江省杭州市"                     
  37. "河北省石家庄市"                  
  38. "新疆维吾尔自治区乌鲁木齐市"
  39. "安徽省合肥市"                     
  40. "江苏省无锡市"                     
  41. "湖南省长沙市"                     
  42. "吉林省吉林市"                     
  43. "江苏省南京市"                     
  44. "湖北省宜昌市"                     
  45. "山东省聊城市东阿县"            
  46. "江苏省徐州市"                     
  47. "内蒙古自治区赤峰市"            
  48. "湖南省长沙市"                     
  49. "广东省广州市"                     
  50. "湖南省张家界市"                  
  51. "山东省寿光市"                     
  52. "辽宁省丹东市"                     
  53. "湖北省武汉市"                     
  54. "海南省海口市"                     
  55. end
复制代码

------------------ copy up to and including the previous line ------------------

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Data 注册地 generated including Starting

沙发
黃河泉 在职认证  发表于 2018-3-14 08:02:01
资料中似乎没有完全一致性的规则,所以可先
  1. split Regplc, parse("省")
复制代码
其他细节可能需进一步自行处理。
已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 10 + 10 精彩帖子

总评分: 经验 + 10  论坛币 + 10   查看全部评分

藤椅
董妞妞 发表于 2018-3-14 16:16:54
很好的方法!谢谢黄老师!!

板凳
dragonlwj 发表于 2018-6-26 22:02:30
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input int idcode byte year float ln_wage
  4. 1 70  1.451214
  5. 1 71 1.0286198
  6. 1 72 1.5899774
  7. 1 73  1.780273
  8. 1 75 1.7770116
  9. 1 77 1.7786806
  10. 1 78  2.493976
  11. 1 80 2.5517154
  12. 1 83 2.4202614
  13. 1 85 2.6141725
  14. 1 87 2.5363736
  15. 1 88  2.462927
  16. 2 71 1.3603482
  17. 2 72 1.2061975
  18. 2 73  1.549883
  19. 2 75  1.832581
  20. 2 77  1.726721
  21. 2 78   1.68991
  22. 2 80  1.726964
  23. 2 82 1.8082886
  24. 2 83  1.863417
  25. 2 85 1.7893666
  26. 2 87 1.8465303
  27. 2 88 1.8564485
  28. 3 68 1.4935614
  29. 3 69 1.7025284
  30. 3 70  1.451214
  31. 3 71 1.5474197
  32. 3 72 1.6072942
  33. 3 73  1.597267
  34. 3 75 1.5358496
  35. 3 77 1.6228406
  36. 3 78  1.566635
  37. 3 80 1.5597233
  38. 3 82 1.6034193
  39. 3 83 1.6142294
  40. 3 85 1.7307986
  41. 3 87 1.5257654
  42. 3 88  1.612777
  43. 4 70 2.2885003
  44. 4 71 2.3755784
  45. 4 72  2.413923
  46. 4 73  2.280939
  47. 4 75 2.2588139
  48. 4 80  1.476236
  49. 4 82 1.2809334
  50. 4 83  1.515855
  51. 4 85 1.9301697
  52. 4 87 1.9190345
  53. 4 88 2.2009745
  54. 5 68  1.627093
  55. 5 69 1.7876856
  56. 5 70  1.820858
  57. 5 71 1.8585224
  58. 5 72 1.9793015
  59. 5 73 1.9904118
  60. 5 75  1.585505
  61. 5 77 1.9375215
  62. 5 78 2.0704923
  63. 5 80  1.830269
  64. 5 82  1.847272
  65. 6 68  1.521732
  66. 6 69 1.4793844
  67. 6 70 1.4793844
  68. 6 71  1.518572
  69. 6 72 1.6072942
  70. 6 73 1.8097416
  71. 6 75 1.8539723
  72. 6 77   1.96311
  73. 6 78  1.982733
  74. 6 80 1.8467982
  75. 6 82 1.8148247
  76. 6 83 1.9199128
  77. 6 85  1.958377
  78. 6 87  2.007068
  79. 6 88 2.0898535
  80. 7 68 1.4820668
  81. 7 69 1.4904344
  82. 7 70 1.5394455
  83. 7 71 1.4938796
  84. 7 72  1.454573
  85. 7 73  1.454573
  86. 7 87  .4733421
  87. 7 88  1.532477
  88. 9 70 1.4722368
  89. 9 71  1.717023
  90. 9 72 1.7472422
  91. 9 73 1.7997917
  92. 9 75  2.017152
  93. 9 77 2.0913637
  94. 9 78 2.1140988
  95. 9 80 2.1137757
  96. 9 82 2.3125353
  97. 9 83 2.3485804
  98. 9 85 2.3734872
  99. 9 87 2.3688986
  100. 9 88 2.3505313
  101. 10 69 1.3616014
  102. 10 70 1.4614837
  103. 10 71 1.6116626
  104. end
复制代码



报纸
小白hah 发表于 2020-1-7 20:58:39
楼主最终是如何解决的,因为我下载的注册地址是详细到区的也需要提取省份和城市,请问您是如何解决的,谢谢

地板
无有代者 发表于 2021-3-13 18:51:15
补充一点,直辖市、自治区、特别行政区。其中地址还有分号和顿号。

7
songking 发表于 2021-3-14 09:53:15
无有代者 发表于 2021-3-13 18:51
补充一点,直辖市、自治区、特别行政区。其中地址还有分号和顿号。
从现在数据来看,以下命令可做到
gen     province=ustrregexs(0) if ustrregexm(Regplc,".*省")
replace province=ustrregexs(0) if ustrregexm(Regplc,".*自治区")
replace province=ustrregexs(0) if ustrregexm(Regplc,"北京市|重庆市|天津市|上海市")

gen     city=ustrregexs(0) if ustrregexm(Regplc,".*?市")
replace city=ustrregexra(city,province,"")


已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
八七七 + 1 + 1 + 1 观点有启发
AaronLawrence + 5 + 2 + 2 + 2 精彩帖子

总评分: 论坛币 + 5  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

8
songking 发表于 2021-3-14 09:53:33
小白hah 发表于 2020-1-7 20:58
楼主最终是如何解决的,因为我下载的注册地址是详细到区的也需要提取省份和城市,请问您是如何解决的,谢谢
gen     province=ustrregexs(0) if ustrregexm(Regplc,".*省")
replace province=ustrregexs(0) if ustrregexm(Regplc,".*自治区")
replace province=ustrregexs(0) if ustrregexm(Regplc,"北京市|重庆市|天津市|上海市")

gen     city=ustrregexs(0) if ustrregexm(Regplc,".*?市")
replace city=ustrregexra(city,province,"")

9
songking 发表于 2021-3-14 09:57:55
审核太严了吗?gen     province=ustrregexs(0) if ustrregexm(Regplc,".*省")
replace province=ustrregexs(0) if ustrregexm(Regplc,".*自治区")
replace province=ustrregexs(0) if ustrregexm(Regplc,"北京市|重庆市|天津市|上海市")

gen     city=ustrregexs(0) if ustrregexm(Regplc,".*?市")
replace city=ustrregexra(city,province,"")



10
songking 发表于 2021-3-14 09:59:23
小白hah 发表于 2020-1-7 20:58
楼主最终是如何解决的,因为我下载的注册地址是详细到区的也需要提取省份和城市,请问您是如何解决的,谢谢
已经回复代码,却说要审核才能通过[]

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 15:30