求助各位大神
我需要对一项文本数据进行处理,它是有关专利申请者的数据,现在我要将申请者类型按企业和个人(主要是如何识别人名的问题)进行分类,那么我该如何处理呢???我尝试过用
replace source="企业" if strmatch(source,"*公司*")|strmatch(source,"*厂*") 去处理,虽然可以成功将企业给整理出来,但由于全部数据中有些申请者是科研机构、服务中心等,因此没法将剩余的当作申请者类型为个人,所以我该如何直接将申请者为个人的整理出来呢
以下是部分数据
* Example generated by -dataex-. To install: ssc install dataex
clear
input str202 apper
"申请人: 马云"
"申请人: 鞍钢实业微细铝粉有限公司"
"申请人: 鞍山双利风机输送机制造有限公司"
"申请人: 鞍钢实业微细铝粉有限公司"
"申请人: 张世祺"
"申请人: 鞍山除尘设备有限公司"
"申请人: 鞍山双利风机输送机制造有限公司"
"申请人: 辽宁瀚正环保设备工程有限公司"
"申请人: 辽宁兰天炉窑集团有限公司"
"申请人: 辽宁瀚正环保设备工程有限公司"
"申请人: 鞍钢集团矿业公司"
"申请人: 鞍钢集团矿业公司"
"申请人: 鞍钢实业微细铝粉有限公司"
"申请人: 徐昌艳"
"申请人: 谷春刚"
"申请人: 辽宁瀚正环保设备工程有限公司"
"申请人: 辽宁瀚正环保设备工程有限公司"
"申请人: 陈喜春"
"申请人: 陈喜春"
"申请人: 鞍钢实业微细铝粉有限公司"
"申请人: 谷春刚"
"申请人: 安徽省安庆市皖清环保科技有限公司"
"申请人: 安庆市虹泰新材料有限责任公司"
"申请人: 刘刚"
"申请人: 陈传松"
"申请人: 陈传松"
"申请人: 枞阳县周泽红家庭农场"
"申请人: 安徽省安庆市皖清环保科技有限公司"
"申请人: 枞阳县宇瑞环保科技有限公司"
"申请人: 安徽中科自动化股份有限公司"
"申请人: 安徽中科自动化股份有限公司"
"申请人: 安徽省绿巨人环境技术有限公司"
"申请人: 安徽美琳建筑材料有限公司"
"申请人: 安徽宝昱电子科技有限公司"
"申请人: 安徽省安庆市皖清环保科技有限公司"
"申请人: 安庆市虹泰新材料有限责任公司"
"申请人: 安庆市虹泰新材料有限责任公司"
"申请人: 安庆市虹泰新材料有限责任公司"
"申请人: 安庆市虹泰新材料有限责任公司"
"申请人: 金先普"
"申请人: 刘刚"
"申请人: 胡显三"
"申请人: 刘刚"
"申请人: 安徽启东热能科技有限公司"
"申请人: 安徽省胜峰机械有限公司"
"申请人: 安庆市虹泰新材料有限责任公司"
"申请人: 枞阳县田园面业有限责任公司"
"申请人: 安徽省安庆市汉城电子通讯有限公司"
"申请人: 刘记"
"申请人: 安徽省安庆市皖清环保科技有限公司"
end


雷达卡






京公网安备 11010802022788号







