楼主: 盐鹅小蜜
12865 10

[数据] 余淼杰合并工业企业数据库和海关数据库的方法 [推广有奖]

  • 0关注
  • 2粉丝

大专生

65%

还不是VIP/贵宾

-

威望
0
论坛币
509 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
373 点
帖子
31
精华
0
在线时间
63 小时
注册时间
2014-12-13
最后登录
2019-11-13

楼主
盐鹅小蜜 发表于 2015-12-30 10:05:36 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在对接工业企业数据库和海关数据库上,余淼杰的文章里用的是邮政编码和电话号码后七位的方法进行合并,也就是用了两个变量来进行对接,请问这样的命令应该怎么写啊?~~
另外海关数据库里一年里好多重复记录,一个公司不会只出现一次,对接的时候发现电话号码、邮政编码这样的变量都无法唯一识别,怎么解决呢。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:工业企业数据库 海关数据库 工业企业数 企业数据 工业企业 数据库 工业

沙发
xuehe 发表于 2016-1-23 22:04:48
公司,法人,地址,都可以啊,不一定要电话号码的,你有没有海关数据?

藤椅
njxxgcdx 发表于 2016-6-3 00:24:19
xuehe 发表于 2016-1-23 22:04
公司,法人,地址,都可以啊,不一定要电话号码的,你有没有海关数据?
我有,qq,1390169394

板凳
stata学习中 发表于 2016-6-3 12:24:48
xuehe 发表于 2016-1-23 22:04
公司,法人,地址,都可以啊,不一定要电话号码的,你有没有海关数据?
我有这个数据库,qq3204939334

报纸
大大小亮妞 发表于 2017-3-29 15:39:27
请问您还有工企和海关数据吗?能否提供给我一份,急需写毕业论文,

地板
日新少年 学生认证  发表于 2017-3-31 19:56:51
求问是余淼杰哪篇的文章

7
杨蕊莉 发表于 2017-4-3 21:29:47 来自手机
楼主您好,工业企业数据与海关数据匹配问题,您解决了吗?能不能教练我,可以总论坛币换,谢谢

8
木木兰当户织 发表于 2017-9-16 10:46:42
日新少年 发表于 2017-3-31 19:56
求问是余淼杰哪篇的文章
企业出口强度与进口中间品贸易自由化——来自中国企业的实证研究`
——田巍,余森杰

三合并数据
尽管这两套数据信息丰富,但是将它门合并到一起却并非易事。两套数据虽然都包括了企业编码,但是两套编制系统却完全不同,没有任何共同特征。比如,在海关数据中企业的编码是10位的,但是在企业数据中却是9位的。为克服这个难题,我们采用Yu和Tian(2012)介绍的方法,采用两种方式合并这两套数据, 首先我们根据企业的姓名和年份匹配, 也就是说,如果两个企业在同一年在两套数据中都有相同的名字,那么这两个企业应该是同一个企业, 这样如果使用原始的工业企业数据, 我们可以匹配83679家企业。如果使用筛选过后的企业数据, 则可以匹配69623家企业。
然后我们用使用了另外一种匹配技术,我们通过企业的邮政编码和最后位的电话号码进行匹配, 因为在每一个邮政地区中, 企业的电话号码都是不同的。尽管这个方法很直观, 但是仍然存在很多细微的实际操作的困难比如在企业数据中电话是包括分机号的,但是在海关数据中却没有, 因此我们采用了电话后7位作为企业认证的近似。
企业在每套数据中都有可能有名称或电话或邮编的缺失, 为了保证我们的匹配可以尽可能包括
更多的企业, 我们同时使用这两种匹配方法, 只要企业可以通过任何一种方法成功匹配,我们就将它
纳人合并数据中。如此, 用原始工业企业数据成功匹配的企业数上升到90558个。与其他类似的文献
比较,我们的匹配数目与他们大抵一样甚至更好。最后我们用筛选后的严格的企业数据匹配,得到
家企业。值得指出的是, 合并的成功率相对比较高,合并后的数据库中企业的总出口额占了规
模以上的数据库的出口额一半以上,与其他相关研究如等的匹配成功率相当。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
夏靥 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

9
木木兰当户织 发表于 2017-9-16 10:46:43
日新少年 发表于 2017-3-31 19:56
求问是余淼杰哪篇的文章
企业出口强度与进口中间品贸易自由化——来自中国企业的实证研究`
——田巍,余森杰

三合并数据
尽管这两套数据信息丰富,但是将它门合并到一起却并非易事。两套数据虽然都包括了企业编码,但是两套编制系统却完全不同,没有任何共同特征。比如,在海关数据中企业的编码是10位的,但是在企业数据中却是9位的。为克服这个难题,我们采用Yu和Tian(2012)介绍的方法,采用两种方式合并这两套数据, 首先我们根据企业的姓名和年份匹配, 也就是说,如果两个企业在同一年在两套数据中都有相同的名字,那么这两个企业应该是同一个企业, 这样如果使用原始的工业企业数据, 我们可以匹配83679家企业。如果使用筛选过后的企业数据, 则可以匹配69623家企业。
然后我们用使用了另外一种匹配技术,我们通过企业的邮政编码和最后位的电话号码进行匹配, 因为在每一个邮政地区中, 企业的电话号码都是不同的。尽管这个方法很直观, 但是仍然存在很多细微的实际操作的困难比如在企业数据中电话是包括分机号的,但是在海关数据中却没有, 因此我们采用了电话后7位作为企业认证的近似。
企业在每套数据中都有可能有名称或电话或邮编的缺失, 为了保证我们的匹配可以尽可能包括
更多的企业, 我们同时使用这两种匹配方法, 只要企业可以通过任何一种方法成功匹配,我们就将它
纳人合并数据中。如此, 用原始工业企业数据成功匹配的企业数上升到90558个。与其他类似的文献
比较,我们的匹配数目与他们大抵一样甚至更好。最后我们用筛选后的严格的企业数据匹配,得到
家企业。值得指出的是, 合并的成功率相对比较高,合并后的数据库中企业的总出口额占了规
模以上的数据库的出口额一半以上,与其他相关研究如等的匹配成功率相当。

10
jiuxun 发表于 2018-6-22 01:19:59
日新少年 发表于 2017-3-31 19:56
求问是余淼杰哪篇的文章
另有 余淼杰 2015 Economic Journal上的文章

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 01:31