楼主: yuren1982
31610 84

[数据管理求助] 海关数据库的处理   [推广有奖]

  • 0关注
  • 11粉丝

副教授

15%

还不是VIP/贵宾

-

威望
0
论坛币
30850 个
通用积分
3.5271
学术水平
25 点
热心指数
13 点
信用等级
25 点
经验
25775 点
帖子
240
精华
1
在线时间
943 小时
注册时间
2005-10-13
最后登录
2024-3-18

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
刚刚得到海关进出口数据库,加上本来已有的工业企业数据库,感觉不做点东西出来就太对不起自己了。但是,刚刚熟悉了工业企业数据库,发现海关进出口数据库的数量级更是惊人,每年数据都在1000万条以上,想向高手请教海关数据库的处理技巧。特别是,如何将海关数据库与工业企业数据库有效匹配?看了论坛里一些帖子,都只提到了思路,但没有讲具体方法,比如有人说将二者的企业名称进行模糊匹配,请问,如何进行模糊匹配的操作?余淼杰的许多研究中提到了匹配方法,但我仍不得要领。请高手赐教!
    附件中是海关数据和工业企业数据的样本,以及余淼杰的几篇用到两种数据库的代表文献。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:海关数据库 海关数据 数据库 关数据 工业企业数据库 数据库 数量级 工业 技巧 如何

数据样本.rar

26.87 KB

本附件包括:

  • 海关数据.xls
  • 工业企业数据.xls

中间品贸易自由化和企业研发_基于中国数据的经验分析_田巍.pdf

1.87 MB

中国出口企业生产率之谜_加工贸易的作用_戴觅.pdf

938.3 KB

企业出口强度与进口中间品贸易自由化_来自中国企业的实证研究_田巍.pdf

2.14 MB

加工贸易_企业生产率和关税减免_来自中国产品面的证据_余淼杰.pdf

1.19 MB

已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
木木兰当户织 + 1 + 1 + 1 精彩帖子
日新少年 + 2 + 2 + 2 精彩帖子
SpencerMeng + 20 + 5 + 1 鼓励积极发帖讨论

总评分: 经验 + 20  论坛币 + 5  学术水平 + 3  热心指数 + 4  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
SpencerMeng 在职认证  发表于 2015-1-9 15:44:52 |只看作者 |坛友微信交流群
楼主,您好,感谢您提供的部分样本数据。

关于匹配问题,您能进一步提供余淼杰关于匹配的具体文献们吗?谢谢!

使用道具

藤椅
yuren1982 发表于 2015-1-9 16:14:30 |只看作者 |坛友微信交流群
SpencerMeng 发表于 2015-1-9 15:44
楼主,您好,感谢您提供的部分样本数据。

关于匹配问题,您能进一步提供余淼杰关于匹配的具体文献们吗? ...
版主您好,已上传余淼杰的几篇代表性文献
已有 1 人评分论坛币 学术水平 信用等级 收起 理由
SpencerMeng + 10 + 1 + 1 奖励积极上传好的资料,多谢!

总评分: 论坛币 + 10  学术水平 + 1  信用等级 + 1   查看全部评分

使用道具

板凳
yizst2 发表于 2015-1-9 22:24:56 来自手机 |只看作者 |坛友微信交流群
主要靠企业名称来匹配,名称匹配不上的,再用地址、电话号码、法人代表等信息匹配。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
日新少年 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

报纸
yuren1982 发表于 2015-1-10 09:24:16 |只看作者 |坛友微信交流群
yizst2 发表于 2015-1-9 22:24
主要靠企业名称来匹配,名称匹配不上的,再用地址、电话号码、法人代表等信息匹配。
你好。请问名称匹配具体需要怎么操作呢?是完全一致的匹配吗?merge命令还是其他什么呢?另外看到有作者说进行模糊匹配,有相关的命令吗?

使用道具

地板
zlke01 发表于 2015-1-27 14:23:08 |只看作者 |坛友微信交流群
楼主你好!
       你的海关进出口数据库时间跨度是多少?

使用道具

7
yuren1982 发表于 2015-1-27 20:51:55 |只看作者 |坛友微信交流群
zlke01 发表于 2015-1-27 14:23
楼主你好!
       你的海关进出口数据库时间跨度是多少?
2000-2010

使用道具

8
yuren1982 发表于 2015-1-28 22:37:24 |只看作者 |坛友微信交流群
SpencerMeng 发表于 2015-1-9 15:44
楼主,您好,感谢您提供的部分样本数据。

关于匹配问题,您能进一步提供余淼杰关于匹配的具体文献们吗? ...
版主您好,我想请问一下,目前stata能处理中文吗?如果不能,那么许多论文中涉及到的用企业名称进行匹配是运用的什么软件呢?

使用道具

9
yuren1982 发表于 2015-1-28 22:37:55 |只看作者 |坛友微信交流群
yizst2 发表于 2015-1-9 22:24
主要靠企业名称来匹配,名称匹配不上的,再用地址、电话号码、法人代表等信息匹配。
靠企业名称匹配,需要用到什么软件呢?

使用道具

10
SpencerMeng 在职认证  发表于 2015-1-29 20:42:39 |只看作者 |坛友微信交流群
yuren1982 发表于 2015-1-28 22:37
版主您好,我想请问一下,目前stata能处理中文吗?如果不能,那么许多论文中涉及到的用企业名称进行匹配是 ...
您好,stata13可以容纳灰常灰常长的字符。。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 13:08