合并海关-工企数据库可以根据(1)企业名称+年份 (2)电话后7位+邮编6位+年份 (3)电话后7位+企业法人+年份;三步依次进行,每一步完成后剔除匹配成功的样本,然后对剩余样本进行匹配。这里,还可以有第(4)步,即在相同省份的范围内,将经过上述3步仍未匹配成功的海关样本和工企库样本的企业名称中的(1)省、市、自治区、盟、区、镇、等字段依次剔除(2)代表地名的 如 镇江、北京 等字段剔除,然后进行匹配,相当于 企业名称(经过处理)+省份(或直辖市)代码+年份 进行匹配。如此进行匹配,效果较好。以下为根据(1)-(3)步匹配的2000-2002年结果:
1.按样本数量分:
出口:
年份 未匹配上 企业名称 电话邮编 电话联系人 匹配成功的样本量 总样本量 匹配率
2000 1,907,758 323,382 63,984 7,662 395,028 2,302,786 17.15%
2001 1,961,111 386,409 59,693 7,212 453,314 2,414,425 18.78%
2002 2,170,820 468,844 58,755 6,753 534,352 2,705,172 19.75%
进口:
年份 未匹配上 企业名称 电话邮编 电话联系人 匹配成功的样本量 总样本量 匹配率
2000 1,354,919 676,108 96,713 10,022 782,843 2,137,762 36.62%
2001 1,306,959 705,428 80,232 9,073 794,733 2,101,692 37.81%
2002 1,427,483 781,248 73,501 8,824 863,573 2,291,056 37.69%
进出口:
年份 未匹配上 企业名称 电话邮编 电话联系人 匹配成功的样本量 总样本量 匹配率
2000 3262677 999490 160697 17684 1177871 4440548 26.53%
2001 3268070 1091837 139925 16285 1248047 4516117 27.64%
2002 3598303 1250092 132256 15577 1397925 4996228 27.98%
2.按贸易金额分:
年份 未匹配上 企业名称 电话邮编 电话联系人 匹配成功的金额 总金额 匹配率
出口 2000 1550 815 113 7 934 2484 37.61%
出口 2001 1525 987 110 15 1112 2637 42.18%
出口 2002 1599 1266 109 9 1384 2983 46.41%
进口 2000 1397 720 102 7 829 2226 37.26%
进口 2001 1429 818 104 14 936 2365 39.58%
进口 2002 1610 1020 90 7 1117 2727 40.95%
进出口 2000 2947 1535 215 14 1764 4710 37.44%
进出口 2001 2954 1804 214 29 2048 5002 40.95%
进出口 2002 3209 2286 199 16 2501 5710 43.80%
|