按年份索引
按国、省、市索引
综合索引
-->
返回列表
提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 道具中心
楼主: niuyangu
9499 24

[公开数据] 工业企业数据库与海关数据库合并问题 [推广有奖]

11
1~^o^~_1 发表于 2017-5-29 20:59:58 |只看作者 |坛友微信交流群
niuyangu 发表于 2016-12-21 15:27
已经解决了,谢谢你
楼主 我也有这个问题 请问怎么解决的啊

使用道具

12
日月之源 学生认证  发表于 2017-8-16 21:51:59 |只看作者 |坛友微信交流群
niuyangu 发表于 2017-3-10 20:23
匹配04年的根据企业名称匹配就可以了
楼主,海关月度数据合并你是怎么合并的,能教我吗?

使用道具

13
vankingfang 发表于 2017-8-25 02:16:22 |只看作者 |坛友微信交流群

hello,我是罗切斯特大学的博士,正愁一份海关数据==, 不知道我是否可以给你提供下帮助,然后你反馈我一些数据? 也可以多交流. 我的邮箱是min.fang@rochester.edu. 感激! 已经丧心病狂的到处回帖了TUT. anyway,可以互相帮助啦!

使用道具

14
jiuxun 发表于 2017-9-14 17:43:56 |只看作者 |坛友微信交流群
合并海关-工企数据库可以根据(1)企业名称+年份 (2)电话后7位+邮编6位+年份 (3)电话后7位+企业法人+年份;三步依次进行,每一步完成后剔除匹配成功的样本,然后对剩余样本进行匹配。这里,还可以有第(4)步,即在相同省份的范围内,将经过上述3步仍未匹配成功的海关样本和工企库样本的企业名称中的(1)省、市、自治区、盟、区、镇、等字段依次剔除(2)代表地名的 如 镇江、北京 等字段剔除,然后进行匹配,相当于 企业名称(经过处理)+省份(或直辖市)代码+年份 进行匹配。如此进行匹配,效果较好。以下为根据(1)-(3)步匹配的2000-2002年结果:
1.按样本数量分:
出口:
年份        未匹配上        企业名称        电话邮编        电话联系人        匹配成功的样本量        总样本量        匹配率
2000        1,907,758        323,382        63,984        7,662        395,028        2,302,786        17.15%
2001        1,961,111        386,409        59,693        7,212        453,314        2,414,425        18.78%
2002        2,170,820        468,844        58,755        6,753        534,352        2,705,172        19.75%

进口:
年份        未匹配上        企业名称        电话邮编        电话联系人        匹配成功的样本量        总样本量        匹配率
2000        1,354,919        676,108        96,713        10,022        782,843        2,137,762        36.62%
2001        1,306,959        705,428        80,232        9,073        794,733        2,101,692        37.81%
2002        1,427,483        781,248        73,501        8,824        863,573        2,291,056        37.69%

进出口:
年份        未匹配上        企业名称        电话邮编        电话联系人        匹配成功的样本量        总样本量        匹配率
2000        3262677        999490        160697        17684        1177871        4440548        26.53%
2001        3268070        1091837        139925        16285        1248047        4516117        27.64%
2002        3598303        1250092        132256        15577        1397925        4996228        27.98%

2.按贸易金额分:
        年份        未匹配上        企业名称        电话邮编        电话联系人        匹配成功的金额        总金额        匹配率
出口        2000        1550        815        113        7        934        2484        37.61%
出口        2001        1525        987        110        15        1112        2637        42.18%
出口        2002        1599        1266        109        9        1384        2983        46.41%
进口        2000        1397        720        102        7        829        2226        37.26%
进口        2001        1429        818        104        14        936        2365        39.58%
进口        2002        1610        1020        90        7        1117        2727        40.95%
进出口        2000        2947        1535        215        14        1764        4710        37.44%
进出口        2001        2954        1804        214        29        2048        5002        40.95%
进出口        2002        3209        2286        199        16        2501        5710        43.80%
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
夏靥 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

niuyangu 发表于 2017-3-10 20:23
匹配04年的根据企业名称匹配就可以了
楼主你是怎么匹配的呀,是根据余淼杰老师的办法吗?自己写的代码吗。好厉害哦。

使用道具

16
数据挖掘8023 学生认证  发表于 2017-12-22 23:07:08 |只看作者 |坛友微信交流群
我手里有2007-2013的海关数据,能否交换呢?

使用道具

17
michaelcxb 学生认证  发表于 2018-2-11 20:41:02 |只看作者 |坛友微信交流群
楼主匹配成功了吗?有偿求方法!

使用道具

18
michaelcxb 学生认证  发表于 2018-2-11 20:46:54 |只看作者 |坛友微信交流群
楼主匹配成功了吗?有偿求code!

使用道具

19
w269750749 学生认证  发表于 2018-9-9 14:14:00 |只看作者 |坛友微信交流群
niuyangu 发表于 2016-12-21 15:28
已经解决了,谢谢
楼主可以提供一下思路吗

使用道具

20
yds1223 发表于 2018-10-5 11:43:54 |只看作者 |坛友微信交流群
出售海关和工业企业数据:
1.海关有2000-20016年数据(已按月度加总到年度数据),3000元
2.工业有98-13,500元
3.海关和工业2000-2009匹配后的stata格式,3000元。
诚心交易,不议价,童叟无欺,如有意向,请加QQ:1291322935,议价者仅仅询问者请勿扰。

使用道具

返回列表
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 16:32