搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  1.dta
资料下载链接地址: https://bbs.pinggu.org/a-3382846.html
附件大小:
在数据处理过程中经常会遇到文本中含有空格,当我们进行merge匹配时,总是匹配失败,这时该怎么办?很多人想到的方案应该都是用subinstr将空格替换掉,但有时候你会发现subinstr可能会失效,比如下面这个例子(今天刚有人问我的)
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str412 name
  4. "中国河南国际合作集团有限公司 "
  5. "临沂蒙水水表有限公司 "
  6. "宁波中泰燃料有限公司 "
  7. "安瑞科(廊坊)能源装备集成有限公司 "
  8. "新疆塔城电力有限责任公司托里供电公司 "
  9. "新疆昌源水务准东供水有限公司 "
  10. "杭州临安恒晟实业投资有限公司 "
  11. "青海黄河上游水电开发有限责任公司 "
  12. end


  13. . list

  14. +---------------------------------------+
  15. | name |
  16. |---------------------------------------|
  17. 1. | 中国河南国际合作集团有限公司|
  18. 2. | 临沂蒙水水表有限公司|
  19. 3. | 宁波中泰燃料有限公司|
  20. 4. | 安瑞科(廊坊)能源装备集成有限公司|
  21. 5. | 新疆塔城电力有限责任公司托里供电公司|
  22. |---------------------------------------|
  23. 6. | 新疆昌源水务准东供水有限公司|
  24. 7. | 杭州临安恒晟实业投资有限公司|
  25. 8. | 青海黄河上游水电开发有限责任公司|
  26. +---------------------------------------+
复制代码

一眼望去似乎没什么问题,但仔细看一下,你会发现公司名称最后一位多了个空格。这时候如果我们采用subinstr来替换空格,你会发现,根本不起作用,不信你可以试试。
  1. . replace name=subinstr(name," ","",.)
  2. (0 real changes made)
复制代码

此时,我想到这可能不是一般意义上的空格,我猜测可能是全角空格、制表符或其他杂七杂八的空格。这个时候,正则表达式就有用武之地了,我们可以用“\s”来干掉这些莫名其妙的空格,我也不用知道你究竟是什么类型空格,全部给你干掉。
  1. . replace name=ustrregexra(name,"\s","")
  2. (8 real changes made)

  3. . list

  4. +--------------------------------------+
  5. | name |
  6. |--------------------------------------|
  7. 1. | 中国河南国际合作集团有限公司 |
  8. 2. | 临沂蒙水水表有限公司 |
  9. 3. | 宁波中泰燃料有限公司 |
  10. 4. | 安瑞科(廊坊)能源装备集成有限公司 |
  11. 5. | 新疆塔城电力有限责任公司托里供电公司 |
  12. |--------------------------------------|
  13. 6. | 新疆昌源水务准东供水有限公司 |
  14. 7. | 杭州临安恒晟实业投资有限公司 |
  15. 8. | 青海黄河上游水电开发有限责任公司 |
  16. +--------------------------------------+
复制代码

Wow,此时可以看到所有的顽固空白都被轻松消灭了。
结语:今后只要遇到去掉空格问题,我们都可以统一采用这种方法,不必再用subinstr了,因为有时候会失效,而上述方法针对一切顽固空格全消灭。


    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-9 07:53