更新时间:2021年12月7日
处理软件:Stata16
样本区间:2003-2020
观测值数量:43006
数据说明:关于中央国企和地方国企的划分一直是大家非常关注并经常使用的数据。我们可以根据实际控制人的性质生成这一变量。实际控制人性质来源主要有两个:一是根据年报披露获得;二是根据股权控制链计算获得。为了最小化样本的缺失值,本人在分别依据两种来源生成中央国企、地方国企和非国企划分变量的基础上,综合两种来源生成了更为齐全的变量(hierarchy),可以直接与上市公司数据进行merge使用。
附件包含内容说明:
1.org:原始 excel 格式数据;
2.out:数据处理过程生成的 dta 格式数据;
3.央企国企划分-GTA.do:数据处理 do 文件;
4.实际控制人性质划分.dta:最终 dta 格式 数据文件;
5实际控制人性质划分.xlsx:最终 xlsx 格式 数据文件
包含变量说明:
1.Stkcd:证券代码
2.year:年份
3.hierarchy1:中央/地方/非国企划分-依据年报
4.hierarchy2:中央/地方/非国企划分-依据股权控制链
5.hierarchy:中央/地方/非国企划分-依据年报和股权控制链(推荐使用)
变量描述性统计:
| variable | N | mean | sd | min | p50 | max |
| hierarchy1 | 41880 | 1.195 | 0.957 | 0 | 2 | 2 |
| hierarchy2 | 42983 | 1.241 | 0.916 | 0 | 2 | 2 |
| hierarchy | 43006 | 1.193 | 0.956 | 0 | 2 | 2 |
各年度观测值:
| 年份 | Freq. | Percent | Cum. |
2003 | 1,282 | 2.98 | 2.98 |
2004 | 1,372 | 3.19 | 6.17 |
2005 | 1,373 | 3.19 | 9.36 |
2006 | 1,454 | 3.38 | 12.74 |
2007 | 1,565 | 3.64 | 16.38 |
2008 | 1,618 | 3.76 | 20.15 |
2009 | 1,762 | 4.1 | 24.24 |
2010 | 2,113 | 4.91 | 29.16 |
2011 | 2,349 | 5.46 | 34.62 |
2012 | 2,469 | 5.74 | 40.36 |
2013 | 2,494 | 5.8 | 46.16 |
2014 | 2,599 | 6.04 | 52.2 |
2015 | 2,775 | 6.45 | 58.65 |
2016 | 3,054 | 7.1 | 65.76 |
2017 | 3,425 | 7.96 | 73.72 |
2018 | 3,506 | 8.15 | 81.87 |
2019 | 3,681 | 8.56 | 90.43 |
2020 | 4,115 | 9.57 | 100 |
| Total | 43,006 | 100 |
代码数据展示:
2003-2020中央国企地方国企及非国企划分
(76 Bytes, 需要: RMB 34 元)


雷达卡




精品数据集集锦:
京公网安备 11010802022788号







