楼主: 天谴冥王
1639 2

[数据管理求助] Stata提取行政区域信息 [推广有奖]

  • 0关注
  • 0粉丝

已卖:2份资源

硕士生

6%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
41.0625
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
256 点
帖子
15
精华
0
在线时间
250 小时
注册时间
2016-12-24
最后登录
2025-10-11

楼主
天谴冥王 发表于 2022-2-16 16:53:34 |AI写论文
109论坛币

我想从下列信息中提取省级和市级行政单位的名字,但是部分没有“省”和“市”标志,如何提取?有否正则表达式?


clear
input str50 失踪地点
"陕西安康市汉滨区秦巴市场大门口"                  
"河北廊坊市安次"                                          
"湖南衡阳市衡山县店门镇天鹅组"                     
"湖南衡阳市"                                                
"甘肃省窑街矿务局"                                          
"河南省南阳市镇平县杨营乡沙家村"                     
"山东省菏泽市张湾镇坯墙赵村227号门前"               
"重庆市杨家坪石平桥后街"                                 
"江西省南昌市新建县铁河农场斜东大队"                                                                              
"山东省枣庄市火车站 "                                      
"黑龙江省齐齐哈尔市龙沙区新立街黄沙滩江岸一带"
"山东省枣庄市火车站"                                       
"河北省邯郸市"                                                
"广东省东莞市黄江镇"                                       
"内蒙古集宁区建桥路30号"                                 
"江苏省南京市三叉河派出所"                              
"山东省泰安市宁阳县东庄乡南石崮村"                  
"安徽省芜湖市南陵县原九年乡九年街道"               
"四川省乐山市中区竹公溪市委办公右侧"               
"四川省成都市蒲江县寿安镇中心幼儿园"               
end



最佳答案

917968079 查看完整内容

用python的cpca库实现起来会比较方便,https://github.com/DQinYuan/chinese_province_city_area_mapper
关键词:Stata 行政区域 tata 行政区 山东省菏泽市 字符串信息提取 正则表达 地区信息提取 stata

沙发
917968079 发表于 2022-2-16 16:53:35
用python的cpca库实现起来会比较方便,https://github.com/DQinYuan/chinese_province_city_area_mapper

藤椅
每天进步alittle 学生认证  发表于 2022-2-22 11:06:40
我曾用最笨的办法,excel的智能分列功能
二楼的解决方法应该不错,当遇到数据量大时,值得一学

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 06:33