数据背景:样本为工业企业数据库企业,每个样本包含企业所在地的行政区划代码,我现在想要用行政区划代码这个指标区分出位于市区和非市区的企业,并产生一个新变量city。以2007年的北京和天津为例,行政区划代码(region_code)如下:
北京
110101 东城区
110102 西城区
110103 崇文区
110104 宣武区
110105 朝阳区
110106 丰台区
110107 石景山区
110108 海淀区
110109 门头沟区
110111 房山区
110112 通州区
110113 顺义区
110114 昌平区
110115 大兴区
110116 怀柔区
110117 平谷区
110228 密云县
110229 延庆县
天津
120101 和平区
120102 河东区
120103 河西区
120104 南开区
120105 河北区
120106 红桥区
120107 塘沽区
120108 汉沽区
120109 大港区
120110 东丽区
120111 西青区
120112 津南区
120113 北辰区
120114 武清区
120115 宝坻区
120221 宁河县
120223 静海县
120225 蓟 县
因为从统计年鉴得知密云县和延庆县不算北京市市区,宁河县、静海县和蓟县不算天津市市区,我想实现把市区的企业的city这值为其所在地城市名,不是市区的企业的city值全部为rural
我想是这样实现:
if 110100<region_code<110118 {
gen city = "beijing"
}
if 120100<region_code<120116 {
gen city = "tianjin"
}
else{
gen city = "rural"
}
但是不对,我刚接触stata,不知道怎么来做,急求各位指点如何实现