要抓狂了我。20万条工作单位,如xx工厂、xx公司,长度不一致,也没有规律。 我想通过R语言提取关键字并组成新的一列。
1、提取关键字如美食、餐饮、电子、个体…
2、组成新的一列。
试过jieba,可它要求是string格式完全不行,我这个单位是factor或者cha。行不通。试过正则表达式,不会弄。
要求就是提取关键字。
有大神帮帮忙吗。
|
楼主: 田伯光嘎嘎
|
1086
2
[问答] R语言处理excel工作单位名称 |
|
大专生 58%
-
|
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


