我想提取出这些地区的省份,直辖市提取市名,但是有的地名统计的是地级市,不符合我的要求,怎样用stata解决这个问题,substr()函数只能简单的提取字符
样本数据:
公司注册地 Freq. Percent
安徽省宣城市 3 0.10 2.78
安徽省宣城市旌德县 1 0.03 2.82
安徽省亳州市 1 0.03 2.85
北京 1 0.03 2.88
北京市 247 7.90 10.78
北京市西城区 2 0.06 11.52
长沙市 1 0.03 11.55
长沙县星沙镇 1 0.03 11.58
成都 2 0.06 11.65
成都市 2 0.06 11.71
大连 1 0.03 11.74
大连市 1 0.03 11.78
佛山市 1 0.03 11.81
福建省南平 1 0.03 13.34
福州市 1 0.03 15.36
甘肃省白银市 1 0.03 15.39
广东省深圳市 199 6.37 28.51
广东省深圳市龙岗区 1 0.03 28.61
广西壮族自治区梧州市 2 0.06 31.26
广州 1 0.03 31.30
广州市 2 0.06 31.36
广州市番禺区 1 0.03 31.39
广州市天河区 1 0.03 31.
贵州省黔南布依族苗族自治州 1 0.03 32.10
贵州省遵义市 4 0.13 32.22
海口市 1 0.03 32.26
海南省昌江县 1 0.03 32.29
海南省澄迈县 1 0.03 32.32
海南省海口市 28 0.90 33.22
海南省三亚市 2 0.06 33.28
杭州市 7 0.22 33.50
合肥市 2 0.06 33.57
惠州市 1 0.03 44.90
吉林省长白山市 1 0.03 44.93
济南市 1 0.03 46.50
江苏省常熟 1 0.03 46.53
龙口市 1 0.03 60.29
洛阳市 1 0.03 60.32
绵阳市 1 0.03 60.35
南京 1 0.03 60.38
南京市 3 0.10 60.48
南通市 1 0.03 60.51
内蒙古包头市 1 0.03 60.54
内蒙古霍林郭勒市 1 0.03 60.58
内蒙古自治区阿拉善左旗 1 0.03 60.61
宁波 1 0.03 61.38
宁波市 1 0.03 61.41
宁夏回族自治区石嘴山市 3 0.10 61.50
宁夏回族自治区吴忠市 2 0.06 61.57
宁夏回族自治区银川市 7 0.22 61.79
潜江市 1 0.03 61.82
青岛市 1 0.03 61.86
青海省海东市互助县 1 0.03 61.89
青海省海西蒙古族藏族自治州 1 0.03 61.92
青海省黄南藏族自治州 1 0.03 61.95
青海省西宁市 9 0.29 62.24
山东济南市 2 0.06 62.30
山西太原市 1 0.03 68.74
陕西省西安市 32 1.02 70.02
陕西省咸阳市 2 0.06 70.08
汕头 1 0.03 70.11
汕头市 3 0.10 70.21
上海 1 0.03 70.24
上海市 237 7.58 77.82
上海市长宁区 1 0.03 77.86
上饶市 1 0.03 78.08
深圳市 34 1.09 79.17
深圳市南山区 3 0.10 79.26
沈阳市 1 0.03 79.30
四川成都市 1 0.03 79.33
四川省阿坝州 1 0.03 79.36
四川省成都市 61 1.95 81.31
苏州 2 0.06 83.20
苏州市 2 0.06 83.26
天津 1 0.03 83.30
天津市 43 1.38 84.67
乌兰察布市 1 0.03 84.70
无锡市 2 0.06 84.77
芜湖 1 0.03 84.80
武汉市 3 0.10 84.90
西安市 5 0.16 85.06
西藏自治区 1 0.03 85.09
西藏自治区拉萨市 10 0.32 85.41
西藏自治区林芝地区 1 0.03 85.44
西藏自治区山南地区 2 0.06 85.50
厦门 2 0.06 85.57
厦门市 2 0.06 85.63
新疆石河子市 1 0.03 85.66
新疆乌鲁木齐市 3 0.10 87.14
烟台市 1 0.03 87.17
宜兴 1 0.03 87.20
湛江 1 0.03 88.32
肇庆市 1 0.03 88.35
浙江省金华市 9 0.29 92.74