在做一个数据分类,原始数据是对十万个人的工作行业调查,行业名称没有统一规范,现在要把这十万个行业根据标准分成12个大的类别(比如矿业,农业,手工业等等)。现在打算通过筛选关键词的方法来产生新变量,比方说含有带有 “食品”两个字的编号为1,带有“土地”两个字的编号为2,以此类推。求问应该怎么写程序?以及请问regexm和indexnot有什么使用区别?
楼主: 990129
|
7417
7
[编程问题求助] 关于regexm的使用 |
小学生 14%
-
|
| ||
| ||
| ||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明