楼主: 溜溜的鹿
1160 2

[面板数据求助] 地区名称规范 [推广有奖]

  • 0关注
  • 0粉丝

本科生

52%

还不是VIP/贵宾

-

威望
0
论坛币
223 个
通用积分
28.4915
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1301 点
帖子
55
精华
0
在线时间
93 小时
注册时间
2017-4-8
最后登录
2024-4-1

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想提取出这些地区的省份,直辖市提取市名,但是有的地名统计的是地级市,不符合我的要求,怎样用stata解决这个问题,substr()函数只能简单的提取字符

样本数据:
公司注册地        Freq.        Percent                       
安徽省宣城市        3        0.10        2.78
安徽省宣城市旌德县        1        0.03        2.82
安徽省亳州市        1        0.03        2.85
北京        1        0.03        2.88
北京市        247        7.90        10.78
北京市西城区        2        0.06        11.52
长沙市        1        0.03        11.55
长沙县星沙镇        1        0.03        11.58
成都                 2        0.06        11.65
成都市        2        0.06        11.71
大连          1        0.03        11.74
大连市        1        0.03        11.78
佛山市        1        0.03        11.81
福建省南平        1        0.03        13.34
福州市        1        0.03        15.36
甘肃省白银市        1        0.03        15.39
广东省深圳市        199        6.37        28.51
广东省深圳市龙岗区        1        0.03        28.61
广西壮族自治区梧州市        2        0.06        31.26
广州        1        0.03        31.30
广州市        2        0.06        31.36
广州市番禺区        1        0.03        31.39
广州市天河区        1        0.03        31.
贵州省黔南布依族苗族自治州        1        0.03        32.10
贵州省遵义市        4        0.13        32.22
海口市        1        0.03        32.26
海南省昌江县        1        0.03        32.29
海南省澄迈县        1        0.03        32.32
海南省海口市        28        0.90        33.22
海南省三亚市        2        0.06        33.28
杭州市        7        0.22        33.50
合肥市        2        0.06        33.57
惠州市        1        0.03        44.90
吉林省长白山市        1        0.03        44.93
济南市        1        0.03        46.50
江苏省常熟        1        0.03        46.53
龙口市        1        0.03        60.29
洛阳市        1        0.03        60.32
绵阳市        1        0.03        60.35
南京        1        0.03        60.38
南京市        3        0.10        60.48
南通市        1        0.03        60.51
内蒙古包头市        1        0.03        60.54
内蒙古霍林郭勒市        1        0.03        60.58
内蒙古自治区阿拉善左旗        1        0.03        60.61
宁波        1        0.03        61.38
宁波市        1        0.03        61.41
宁夏回族自治区石嘴山市        3        0.10        61.50
宁夏回族自治区吴忠市        2        0.06        61.57
宁夏回族自治区银川市        7        0.22        61.79
潜江市        1        0.03        61.82
青岛市        1        0.03        61.86
青海省海东市互助县        1        0.03        61.89
青海省海西蒙古族藏族自治州        1        0.03        61.92
青海省黄南藏族自治州        1        0.03        61.95
青海省西宁市        9        0.29        62.24
山东济南市        2        0.06        62.30
山西太原市        1        0.03        68.74
陕西省西安市        32        1.02        70.02
陕西省咸阳市        2        0.06        70.08
汕头        1        0.03        70.11
汕头市        3        0.10        70.21
上海        1        0.03        70.24
上海市        237        7.58        77.82
上海市长宁区        1        0.03        77.86
上饶市        1        0.03        78.08
深圳市        34        1.09        79.17
深圳市南山区        3        0.10        79.26
沈阳市        1        0.03        79.30
四川成都市        1        0.03        79.33
四川省阿坝州        1        0.03        79.36
四川省成都市        61        1.95        81.31
苏州        2        0.06        83.20
苏州市        2        0.06        83.26
天津        1        0.03        83.30
天津市        43        1.38        84.67
乌兰察布市        1        0.03        84.70
无锡市        2        0.06        84.77
芜湖        1        0.03        84.80
武汉市        3        0.10        84.90
西安市        5        0.16        85.06
西藏自治区        1        0.03        85.09
西藏自治区拉萨市        10        0.32        85.41
西藏自治区林芝地区        1        0.03        85.44
西藏自治区山南地区        2        0.06        85.50
厦门        2        0.06        85.57
厦门市        2        0.06        85.63
新疆石河子市        1        0.03        85.66
新疆乌鲁木齐市        3        0.10        87.14
烟台市        1        0.03        87.17
宜兴        1        0.03        87.20
湛江        1        0.03        88.32
肇庆市        1        0.03        88.35
浙江省金华市        9        0.29        92.74


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:stata 数据处理 文字提取

沙发
左耳cz 发表于 2017-8-12 12:11:17 |只看作者 |坛友微信交流群
你这个问题有点麻烦,因为那些直接给出地级市的你没法归属它的省份,所以我给出了一个解决方案可能不是最好的,就是直接将那些地级市的删除了,保留那些有省份名称的。下面是我代码。
  1. gen pro = substr(location,1,6)
  2. gen pro_x = inlist(pro, "北京","安徽","广东","四川", ///
  3.                         "湖南","上海","天津")         //你在这里可以将34个省市加进去
  4. keep if pro_x == 1
复制代码
屏幕快照 2017-08-12 下午12.10.00.png 屏幕快照 2017-08-12 下午12.10.31.png

使用道具

藤椅
溜溜的鹿 发表于 2017-8-13 21:02:11 |只看作者 |坛友微信交流群
左耳cz 发表于 2017-8-12 12:11
你这个问题有点麻烦,因为那些直接给出地级市的你没法归属它的省份,所以我给出了一个解决方案可能不是最好 ...
我试了下,但是表达式太长了,不能运行

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-10-5 21:20