更新时间:2022年6月28日
处理软件:Stata16
观测值数量:
(1)983325(董监高个人特征1)
(2)2837065(董监高个人特征2)
楼主提示:数据处理难点如下:
1.相同变量填补缺失值:同一个人同一个变量可能有不同的缺失值,比如某高管年龄或性别在公司A的观测值中不存在缺失,但在公司B(可能存在兼职)可能是缺失的,需将这部分缺失补齐。另外,同一变量来自不同子库缺失值状况可能不同,比如学历程度,这也需要相互补齐,生成一个缺失值最少的变量。
2.教育背景缺失值填充:对于固定的变量或能够建立对应关系的变量(比如同一公司同一年的行业)都很容易相互补充缺失值。但学历稍有不同,因为它可能发生改变,比如一个高管2008年是硕士,2009-2012年的学历是缺失的,2013年开始就是博士了,如果假定2013年是博士的第一年,2009-2012就应该将缺失值填充为硕士。因为一个人的学历只会上升或不变,但不会下降。
附件内容(购买链接见本贴末尾):
1.董监高个人特征数据(GTAperson2021)
(1)org文件夹:原始数据文件夹
(2)out文件夹:处理过程中生成的 dta 文件
(3)xls文件夹:原始数据解压后的 excel 文件
(4)GTAperson2021.do:数据处理 do 文件
(5)GTAperson2021-1.dta:董监高个人特征最终数据1 dta 格式
(6)GTAperson2021-2.dta:董监高个人特征最终数据2 dta 格式
注意:大家购买前可先免费下载变量说明和样本数据
各年度观测值:
(1)数据1
年份 | Freq. | Percent | Cum. |
1990 | 10 | 0 | 0 |
1991 | 8 | 0 | 0 |
1992 | 481 | 0.05 | 0.05 |
1993 | 1,737 | 0.18 | 0.23 |
1994 | 1,669 | 0.17 | 0.4 |
1995 | 374 | 0.04 | 0.44 |
1996 | 3,145 | 0.32 | 0.75 |
1997 | 3,248 | 0.33 | 1.09 |
1998 | 1,732 | 0.18 | 1.26 |
1999 | 17,210 | 1.75 | 3.01 |
2000 | 20,429 | 2.08 | 5.09 |
2001 | 21,272 | 2.16 | 7.25 |
2002 | 23,386 | 2.38 | 9.63 |
2003 | 24,749 | 2.52 | 12.15 |
2004 | 27,011 | 2.75 | 14.89 |
2005 | 25,059 | 2.55 | 17.44 |
2006 | 27,163 | 2.76 | 20.21 |
2007 | 30,498 | 3.1 | 23.31 |
2008 | 31,547 | 3.21 | 26.51 |
2009 | 34,107 | 3.47 | 29.98 |
2010 | 44,555 | 4.53 | 34.51 |
2011 | 48,920 | 4.97 | 39.49 |
2012 | 50,502 | 5.14 | 44.63 |
2013 | 49,566 | 5.04 | 49.67 |
2014 | 54,735 | 5.57 | 55.23 |
2015 | 58,990 | 6 | 61.23 |
2016 | 64,014 | 6.51 | 67.74 |
2017 | 73,838 | 7.51 | 75.25 |
2018 | 70,046 | 7.12 | 82.37 |
2019 | 75,436 | 7.67 | 90.05 |
2020 | 86,596 | 8.81 | 98.85 |
2021 | 8,409 | 0.86 | 99.71 |
2022 | 2,883 | 0.29 | 100 |
Total | 983,325 | 100 |
(2)数据2
年份 | Freq. | Percent | Cum. |
1990 | 9 | 0 | 0 |
1991 | 9 | 0 | 0 |
1992 | 20 | 0 | 0 |
1993 | 127 | 0 | 0.01 |
1994 | 160 | 0.01 | 0.01 |
1995 | 197 | 0.01 | 0.02 |
1996 | 1,149 | 0.04 | 0.06 |
1997 | 4,718 | 0.17 | 0.23 |
1998 | 8,899 | 0.31 | 0.54 |
1999 | 17,259 | 0.61 | 1.15 |
2000 | 24,159 | 0.85 | 2 |
2001 | 28,780 | 1.01 | 3.01 |
2002 | 36,662 | 1.29 | 4.31 |
2003 | 42,084 | 1.48 | 5.79 |
2004 | 48,123 | 1.7 | 7.49 |
2005 | 53,933 | 1.9 | 9.39 |
2006 | 60,053 | 2.12 | 11.5 |
2007 | 71,919 | 2.53 | 14.04 |
2008 | 83,345 | 2.94 | 16.98 |
2009 | 94,033 | 3.31 | 20.29 |
2010 | 106,364 | 3.75 | 24.04 |
2011 | 116,863 | 4.12 | 28.16 |
2012 | 126,422 | 4.46 | 32.61 |
2013 | 138,942 | 4.9 | 37.51 |
2014 | 158,737 | 5.6 | 43.11 |
2015 | 178,964 | 6.31 | 49.41 |
2016 | 196,900 | 6.94 | 56.36 |
2017 | 214,298 | 7.55 | 63.91 |
2018 | 232,434 | 8.19 | 72.1 |
2019 | 251,598 | 8.87 | 80.97 |
2020 | 268,936 | 9.48 | 90.45 |
2021 | 270,969 | 9.55 | 100 |
Total | 2,837,065 | 100 |
数据代码展示: