1161 2

[编程问题求助] Stata如何分离字符串里的字母和汉字成为两个单独的变量 [推广有奖]

  • 1关注
  • 2粉丝

已卖:92份资源

讲师

19%

还不是VIP/贵宾

-

威望
0
论坛币
49532 个
通用积分
107.4776
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
52179 点
帖子
87
精华
0
在线时间
693 小时
注册时间
2017-6-20
最后登录
2025-12-13

楼主
分田分地真忙 发表于 2023-11-17 16:12:30 |AI写论文
100论坛币
数据中有一个变量,是以字母或者*开头的,字母的长度并不固定,没有明显的可以split特征。如何将第一个汉字前面的字符形成一个单独的变量,第一个汉字及以后的字符形成另一个单独的变量呢?
  1. clear
  2. input str20 name
  3. "PU中海田z"
  4. "sgT泰宁"
  5. "*ry区北运W丰"
  6. end
复制代码
效果如下:
Snipaste_2023-11-17_16-10-39.png

最佳答案

wdlbcj 查看完整内容

gen first = regexs(1) if regexm(var1, "^([A-Za-z*]+)") gen second=subinstr(var1,first,"",.) 试试这个
关键词:Stata tata 字符串 Input split

沙发
wdlbcj 学生认证  发表于 2023-11-17 16:12:31
gen first = regexs(1) if regexm(var1, "^([A-Za-z*]+)")

gen second=subinstr(var1,first,"",.)
试试这个

藤椅
分田分地真忙 发表于 2023-11-20 06:01:26
wdlbcj 发表于 2023-11-19 17:06
gen first = regexs(1) if regexm(var1, "^([A-Za-z*]+)")

gen second=subinstr(var1,first,"",.)
十分感谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-1 18:51