更新时间:2023年5月30日
处理软件:Stata16
样本区间:2003-2022
观测值数量:49824
数据说明:关于中央国企和地方国企的划分一直是大家非常关注并经常使用的数据。我们可以根据实际控制人的性质生成这一变量。实际控制人性质来源主要有两个:一是根据年报披露获得;二是根据股权控制链计算获得。为了最小化样本的缺失值,本人在分别依据两种来源生成中央国企、地方国企和非国企划分变量的基础上,综合两种来源生成了更为齐全的变量(hierarchy),可以直接与上市公司数据进行merge使用。
附件包含内容说明:
1.org:原始 excel 格式数据;
2.out:数据处理过程生成的 dta 格式数据;
3.央企国企划分-GTA.do:数据处理 do 文件;
4.实际控制人性质划分.dta:最终 dta 格式 数据文件;
5实际控制人性质划分.xlsx:最终 xlsx 格式 数据文件
包含变量说明:
1.Stkcd:证券代码
2.year:年份
3.hierarchy1:中央/地方/非国企划分-依据年报
4.hierarchy2:中央/地方/非国企划分-依据股权控制链
5.hierarchy:中央/地方/非国企划分-依据年报和股权控制链(推荐使用)
变量描述性统计:
variable | N | mean | sd | min | p50 | max |
hierarchy1 | 48495 | 1.228 | 0.95 | 0 | 2 | 2 |
hierarchy2 | 49703 | 1.271 | 0.909 | 0 | 2 | 2 |
hierarchy | 49824 | 1.226 | 0.949 | 0 | 2 | 2 |
各年度观测值:
年份 | Freq. | Percent | Cum. |
2003 | 1,282 | 2.57 | 2.57 |
2004 | 1,372 | 2.75 | 5.33 |
2005 | 1,373 | 2.76 | 8.08 |
2006 | 1,454 | 2.92 | 11 |
2007 | 1,565 | 3.14 | 14.14 |
2008 | 1,618 | 3.25 | 17.39 |
2009 | 1,762 | 3.54 | 20.93 |
2010 | 2,113 | 4.24 | 25.17 |
2011 | 2,349 | 4.71 | 29.88 |
2012 | 2,469 | 4.96 | 34.84 |
2013 | 2,494 | 5.01 | 39.84 |
2014 | 2,599 | 5.22 | 45.06 |
2015 | 2,775 | 5.57 | 50.63 |
2016 | 3,054 | 6.13 | 56.76 |
2017 | 3,425 | 6.87 | 63.63 |
2018 | 3,506 | 7.04 | 70.67 |
2019 | 3,683 | 7.39 | 78.06 |
2020 | 4,156 | 8.34 | 86.4 |
2021 | 4,600 | 9.23 | 95.63 |
2022 | 2,175 | 4.37 | 100 |
Total | 49,824 | 100 |
注:这里2022的数据感觉不太够,这可能是原始数据更新的问题,我将在6、7月份再免费更新一版,当然,在实际使用过程中,merge完自己的上市公司样本数据,可以将2022的数据替换为2021。
代码数据展示: