楼主: jxapp_38306
2945 2

[数据管理求助] stata提取变量中的中英文、数字 [推广有奖]

  • 3关注
  • 1粉丝

讲师

44%

还不是VIP/贵宾

-

威望
0
论坛币
4122 个
通用积分
20.2906
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
1313 点
帖子
70
精华
0
在线时间
928 小时
注册时间
2017-3-2
最后登录
2023-6-8

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,本人比较懒,不喜欢把代码搞长,希望有最短的代码把事儿办了。

尝试用以下正则表达式方法处理:
g new_var = ustrregexs(0) if ustrregexm(var,"[0-9A-Za-z\u4e00-\u9fa5]+")


var为原始变量(第一列),new_var 为提取后的变量(第二列)
但是发现只能提取到第一部分,如果有间断就不成功,如下图


QQ截图20210608095642.png QQ截图20210608095616.png
当然,数据中涉及的异常符号很多,不限于此,希望各位大佬给点建议!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 中英文 正则表达式 USTR

沙发
jxapp_38306 学生认证  发表于 2021-6-8 11:48:19 |只看作者 |坛友微信交流群
淦!
本韩国这帮企业起个名字还不好好用英文,真够了

使用道具

藤椅
Jazwang 发表于 2022-6-26 20:22:20 |只看作者 |坛友微信交流群
真的是太厉害了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 16:21