一、中国工业企业数据库(2000-2015年)
工业企业数据全称为“全部国有及规模以上(企业每年主营业务收入(销售额)在500 万元以上,2011 年起为 2000 万元以上)非国有工业企业数据”,数据来源于国家统计局,依据《工业统计报表制度》而进行的工业调查统计。其统计内容包含工业企业产销状况、财务状况、成本费用情况、主要工业产品销售、库存和生产能力以及企业生产经营景气状况等方面。可用于了解全国工业生产经营活动的基本情况,为各级政府制定政策和规划、进行经济管理与调控提供依据。
每年的企业数量平均已近30万家
共计四百多万个观测值,包含企业所有的财务指标,近200个变量,是非常详细的企业层面的数据。来源于国内top2高校,现有原始数据和跨年匹配好的数据,匹配方法来自于Challenges of Working with the Chinese NBS Firm-level Data, byLorenBrandt, Johannes Van Biesebroeck, and Yifan Zhang (2014). China EconomicReview
二、海关数据库(2000-2016年)(16年缺失值较多)
中国海关数据库是研究贸易相关问题的基础数据库,该数据库涵盖中国每一笔进口和出口商品的通关贸易数据,变量包括HS编码、企业名称、进口/出口、港口、目的国、商品名称、贸易方式、金额、数量、计价单位、企业地址、电话、邮编、城市、贸易方、企业类型等等。
包括企业名称,时间,货物,重量,价值,通关地点,目的地,进口国/出口国等诸多信息。
三、中国工业企业数据库与海关数据库匹配数据(2000-2014年)
参考田巍和余淼杰2014年发表在《世界经济》的那篇高被引论文:中间品贸易自由化和企业研发——基于中国数据的经验分析
数据包含匹配结果数据,以及数据匹配代码
《中国工业企业数据库》和《中国海关进出口数据库》相匹配的数据及代码,匹配方法来自于余淼杰2014年发表在中文顶刊《经济学季刊》的论文《中国出口企业生产率之谜:加工贸易的作用》和余淼杰2014年发表在英文顶刊《Review of Economics andStatistics》的论文《Exports and credit constraints underincomplete information: Theory and evidence from China》。基本思路是先用企业名称匹配,然后用邮编、电话号码后六位等信息辅助匹配。