楼主: jingjuan1997
4835 6

[Stata] 如何从一串既有文字又有数字的语句中提取数字 [推广有奖]

  • 4关注
  • 3粉丝

博士生

2%

还不是VIP/贵宾

-

威望
0
论坛币
36959 个
通用积分
84.3556
学术水平
5 点
热心指数
5 点
信用等级
5 点
经验
9347 点
帖子
104
精华
0
在线时间
281 小时
注册时间
2017-6-2
最后登录
2024-4-12

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
老师同学好,请问一下如何从一串既有文字又有数字的语句中提取数字,
并且每个观察值语句的长短是不一的,不像年月日长短是整齐的,对于不
整齐的有没有什么办法提取?

例如:
id     context
1     有普通员工389名,其中大学以下学历人数占40%,硕士以上学历占12%,博士以上学历占10%  
2     一般员工422名,工作3年以上占61.2%,工作5年以上占43.8%,工作10年以上占9.88%  


提取
id  v1      v2         v3         v4
1  389    40%      12%      10%
2  422    61.2%     43.8%  9.88%


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Context Contex Text TeX 有没有

已有 1 人评分论坛币 收起 理由
happy_287422301 + 20 鼓励积极发帖讨论

总评分: 论坛币 + 20   查看全部评分

沙发
jingjuan1997 学生认证  发表于 2018-2-11 21:21:21 |只看作者 |坛友微信交流群
好像有个扫描功能的命令,忽然忘了

使用道具

藤椅
jingjuan1997 学生认证  发表于 2018-2-12 12:12:11 |只看作者 |坛友微信交流群
在线等,哪位大神帮帮忙

使用道具

板凳
lxl2603 发表于 2018-2-16 22:46:20 |只看作者 |坛友微信交流群
用Excel。
假设:原始数据“有普通员工……”放在B1单元格
C1单元格输入:=MID(B1,FIND("工",B1)+1,FIND("名",B1)-FIND("工",B1)-1)
D1单元格输入:=MID(B1,FIND("占",B1)+1,FIND("%",B1)-FIND("占",B1))
E1单元格输入:=MID(B1,FIND("占",B1,FIND("占",B1)+1)+1,FIND("%",B1,FIND("%",B1)+1)-FIND("占",B1,FIND("占",B1)+1))
F1单元格输入:=MID(B1,FIND("占",B1,FIND("占",B1,FIND("占",B1)+1)+1)+1,FIND("%",B1,FIND("%",B1,FIND("%",B1)+1)+1)-FIND("占",B1,FIND("占",B1,FIND("占",B1)+1)+1))

其他类推。

使用道具

报纸
jingjuan1997 学生认证  发表于 2020-6-4 17:09:11 |只看作者 |坛友微信交流群
现在找到一个更快的方法,下载方方格子,安装到excel里

使用道具

地板
jingjuan1997 学生认证  发表于 2020-6-4 17:19:20 |只看作者 |坛友微信交流群
jingjuan1997 发表于 2018-2-11 21:21
好像有个扫描功能的命令,忽然忘了
regexm  命令
gen day = regexs(0) if regexm(date, "^[0-9]+")
gen month = regexs(0) if regexm(date, "[a-zA-Z]+")
gen year = regexs(0) if regexm(date, "[0-9]*$")
replace year = "20"+regexs(0) if regexm(year, "^[0][0-9]$")
replace year = "19"+regexs(0) if regexm(year, "^[1-9][0-9]$")
gen date2 = day+month+year

使用道具

7
jingjuan1997 学生认证  发表于 2020-6-4 17:20:07 |只看作者 |坛友微信交流群
jingjuan1997 发表于 2018-2-11 21:21
好像有个扫描功能的命令,忽然忘了
regexm

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 18:28