中国工业企业数据库十分庞大,处理起来也比较费力。
当前学术界用的一般都是在2006年及以前的数据。
在处理过程中,遇到一些问题,在综合其它文献的基础上,给出本人的处理方式,
希望同用这个数据库的坛友在处理过各中遇到的问题,可以相互讨论。
[size=14.193549156189px]具体流程如下:
[size=14.193549156189px]
1.去除总资产,职工人数,工业总产值,固定资产净值,销售额 缺失值
2.保留实收资本>0企业
3.检查企业类型:国有资本/实收资本=ratio
ratio>0.5, 国有控股
4. 规模以上企业:国有企业+非国有但销售额过500万
2006年以前,以500万为线,2006后,以2000万为线
备注:一般来说,工业企业数据库的单位是千元,所以这里在做判别时需要以5000为界
5.职工人数小于8,缺乏有效会计系统
6.固定资产、总资产、工业总产值为0,剔除
7.总资产小于流动资产,总资产小于固定资产净值、累计折旧小于当期折旧,这三个不符合会计准则
8.重复企业单独挑出来