老师同学好,请问一下如何从一串既有文字又有数字的语句中提取数字,
并且每个观察值语句的长短是不一的,不像年月日长短是整齐的,对于不
整齐的有没有什么办法提取?
例如:
id context
1 有普通员工389名,其中大学以下学历人数占40%,硕士以上学历占12%,博士以上学历占10%
2 一般员工422名,工作3年以上占61.2%,工作5年以上占43.8%,工作10年以上占9.88%
提取
id v1 v2 v3 v4
1 389 40% 12% 10%
2 422 61.2% 43.8% 9.88%