楼主: 小白hah
15009 20

[数据管理求助] 上市公司注册地如何提取省份和城市 [推广有奖]

11
gfyyy 学生认证  发表于 2020-10-20 21:10:22
同问楼主解决了么,想知道应该怎么解决

12
gfyyy 学生认证  发表于 2020-10-20 23:13:43
同问,想问问楼主解决了么求助!

13
无有代者 发表于 2021-3-13 18:50:11
友情提示,直辖市、自治区、特别行政区。

14
songking 发表于 2021-3-14 14:43:41
无有代者 发表于 2021-3-13 18:50
友情提示,直辖市、自治区、特别行政区。

https://bbs.pinggu.org/thread-6272311-1-1.html
gen     province=ustrregexs(0) if ustrregexm(Regplc,".*省")
replace province=ustrregexs(0) if ustrregexm(Regplc,".*自治区")
replace province=ustrregexs(0) if ustrregexm(Regplc,"北京市|重庆市|天津市|上海市")

gen     city=ustrregexs(0) if ustrregexm(Regplc,".*?市")
replace city=ustrregexra(city,province,"")

15
songking 发表于 2021-3-14 14:46:04
无有代者 发表于 2021-3-13 18:50
友情提示,直辖市、自治区、特别行政区。

https://bbs.pinggu.org/thread-6272311-2-1.html

16
无有代者 发表于 2021-3-15 09:52:29
songking 发表于 2021-3-14 14:46

https://bbs.pinggu.org/thread-6272311-2-1.html
国泰安的很多公司地址格式不规范,比如不显示XX省,直接就是XX市,还有如西藏林芝市,中国福建,再有两个地址用顿号、分号隔开。我是手动处理的。
  1. split registeraddress,p("省")  
复制代码
  1. replace registeraddress1="西藏" if strmatch(registeraddress1,"*西藏自治区*")&length(trim(registeraddress1))!=2  
  2. replace registeraddress1="广西" if strmatch(registeraddress1,"*广西壮族*")&length(trim(registeraddress1))!=2  
  3. replace registeraddress1="内蒙" if strmatch(registeraddress1,"*内蒙古自治区*")&length(trim(registeraddress1))!=2  
  4. replace registeraddress1="宁夏" if strmatch(registeraddress1,"*宁夏回族*")&length(trim(registeraddress1))!=2  
  5. replace registeraddress1="新疆" if strmatch(registeraddress1,"*新疆*")&length(trim(registeraddress1))!=2  
复制代码

17
songking 发表于 2021-3-15 10:30:09
无有代者 发表于 2021-3-15 09:52
国泰安的很多公司地址格式不规范,比如不显示XX省,直接就是XX市,还有如西藏林芝市,中国福建,再有两个 ...
均可处理,但要给数据示例

18
无有代者 发表于 2021-3-15 11:16:32
songking 发表于 2021-3-15 10:30
均可处理,但要给数据示例
您是说dataex吧?
这种不规范的是少数,3000多家上市公司,大概就20多个,所以dataex效果不好。
我是处理完用Excel的筛选功能看到的,本来有一张截图,但是经管之家论坛好像只支持在线的图片。

19
小小仙子 发表于 2021-3-31 08:47:50 来自手机
小白hah 发表于 2020-1-7 13:50
从国泰安下载的注册地位详细地址在stata中如何分别提取城市和省份
可在excel中处理好

20
710549 发表于 2022-4-29 19:29:38
请问楼主的问题解决了吗

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 14:06