详细帖子地址:
https://bbs.pinggu.org/thread-10693126-1-1.html
1998—2013工企数据、2000—2013海关数据,均来自国内某top高校,数据质量非常高。
本套数据和代码完全按照苏丹妮等(2018)《产业集聚与企业出口产品质量升级》的方法测算了2000—2013年出口产品质量,测算了企业—年份—产品层面的出口质量,也把出口产品质量加权到了企业—年份层面。
测算出口产品质量过程中存在的问题详细写了一个word文档《工企数据及出口产品质量测算过程中存在的问题及解决办法》(在附件中)。
工企1998—2013年的数据是原始数据,按照brandt(2012)的方法匹配的,包含了所有变量,每年的工企数据中都有企业匹配唯一识别码id_new和年份(year)。
海关数据与工企数据是按照田巍和余淼杰(2013)的方法匹配的。
附件中包含的数据、do文档可以直接测算出口产品质量,并提取工企变量,然后把工企数据和海关数据进行匹配(用id_new和year,即可实现1:1匹配)。
本套数据资料包括(共23g):
(1)1998—2013工企原始数据。
名称为gq1998等,包含企业匹配唯一识别码id_new和年份(year),共计16年。(如果将所有年份工企数据进行合并,共计400多万个观测值)。
(2)2000—2013海关原始数据。
名称为hg2000_2013,9g,包含企业匹配唯一识别码id_new和年份(year),共计6000多万个观测值(包括出口和进口)。海关数据包括的变量有:id_new、year、进口或出口、税号编码、金额、数量、价格、起运国或目的国、贸易方式、gdp(各省实际gdp,在测算出口产品质量时要用)。
(3)do文档。
do文档包含了测算出口产品质量的全部代码,并且含有详细的注释。因为工企数据是历年的,所以do文档还包含了提取历年工企变量、合并工企变量、匹配海关数据的详细代码。下载附件后,在do文档中修改工作路径,即可运行。
(4)1995_2016美元汇率数据。
因为海关数据中金额(即出口额)单位是美元,而工企数据中单位是千元,需要用汇率进行转换。
(5)1998_2013工企数据各年变量对照表。
对照表详细列示了历年工企包含的变量,可以对照参考,在提取工企变量时方便查找。
可以免费下载预览。
(6)word文档《工企数据及出口产品质量测算过程中存在的问题及解决办法》
详细说明了出口产品质量测算过程中存在的问题,有参考文献。
(7)一些重要的参考文献。
整理了一些比较重要的参考文献。
一、关于工企数据
(1)数据的匹配问题
1998—2013年工企数据来源于国内某top高校,按照brandt等(2012)的方法进行匹配的,详细匹配过程可参考原文献和国内相关文献,匹配后每年每个观测值都有唯一的匹配识别代码id_new,因此用id_new和year(年份变量),就能唯一确定某个观测值,匹配完成后1998—2013年共计400多万个观测值,200来个变量,包括数据库中所有的变量,17g左右。
但是,从1998—2013年合并后的工企数据提取变量比较费劲,数据太大,光读取数据就很麻烦,而且并不是所有的变量都是实证需要的。因此,匹配好后,又把每年的数据单独进行了保存,名字为gq1998、gq1999等,详细可以参照《1998_2013工企数据各年变量对照表》,需要哪些变量就提取哪些变量,在do文档的最后,有提取变量的代码,一键式提取,非常方便。
为了方便大家了解各年变量情况,附件可以下载查看。
(2)为什么数据只到2013年
1.数据来源方面
因为1998—2013年的数据来自国内top高校,数据质量非常高,很权威,质量有保证。而目前市面上出现的2014和2015年数据并非来自该高校,具体来源不详,质量无法保证。做实证研究,数据详实可靠是第一位的。
2.实证研究方面
目前最新的大部分文献也是利用1998—2013年的工企数据进行研究(张晶和陈志龙2021[ii];田素华和王璇,2021[iii];孙鲲鹏等,2021[iv]),文献很多,这里不再一一列举。所以近几年内,使用1998—2013年工企数据进行研究足够了。
二、关于海关数据
海关原始数据是2000—2014,与工企数据来源相同,数据质量很高,但是考虑到工企数据只到13年,因此海关数据剔除了2014年。按照田巍和余淼杰(2013[v])的方法对工企数据和海关数据逐年进行匹配,详细匹配过程可看文献。海关数据和工企数据匹配完成后,每个观测值都包含了id_new和year(年份变量)。然后将历年海关数据进行了合并。海关数据中只保留了关键变量,具体包括:id_new、year、进口或出口、税号编码、金额、数量、价格、起运国或目的国、贸易方式、gdp(各省实际gdp,在测算出口产品质量时要用),共6000多万个观测值(包括出口和进口),9g左右。由于保留的变量越多,数据越大,不利于读取和计算。
参考文献:
BrandtL , Biesebroeck J V , Zhang Y . Creative Accounting orCreative Destruction? Firm-level Productivity Growth in ChineseManufacturing[J]. Journal of Development Economics, 2012, 97( 2):339-351.
[ii] 张晶,陈志龙.劳动力成本上升与中国制造业转移[J].统计研究,2021,38(06):70-85.
[iii] 田素华,王璇.贸易联系与生产性补贴的出口促进效应——基于HS-6位码产品的中国微观数据实证分析[J].国际贸易问题,2021(06):63-79.
[iv] 孙鲲鹏,方明月,包家昊.如何“混改”更好——国企混合所有制股权组合模式对企业绩效的影响[J].财贸经济,2021,42(06):87-103.
[v] 田巍,余淼杰.企业出口强度与进口中间品贸易自由化:来自中国企业的实证研究[J].管理世界,2013(01):28-44.