| 所在主题: | |
| 文件名: regional_code.xls | |
| 资料下载链接地址: https://bbs.pinggu.org/a-1849009.html | |
| 附件大小: | |
|
最近写论文需要整理统计局发布的行政区域代码,因为从网页上copy 下来就是代码和地名混在一列,所以需要把代码和地名分开。导入stata后,整理数据,由于代码都是六位,所以用--substr-- 命令很容易就整理好了,但是当需要整理地名的时候,因为地名长度不一致,所以想到用stata内置的正则表达式 --regex-- --regexm--, 但是我发现,当我使用类似于 ([a-zA-Z]+)$ 这样的正则表达式的时候,返回的都是空值,gen county = regexs(0) if regexm(region, "([a-zA-Z]+)$"),我反反复复尝试了各种组合都是这个结果,这让我非常困惑,是否stata里面的正则表达式不适用于中文字符?
|
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明