更新时间:2024年5月30日
处理软件:Stata16
观测值数量:
(1)1175329(董监高个人特征1)
(2)3221277(董监高个人特征2)
楼主提示:数据处理难点如下:
1.相同变量填补缺失值:同一个人同一个变量可能有不同的缺失值,比如某高管年龄或性别在公司A的观测值中不存在缺失,但在公司B(可能存在兼职)可能是缺失的,需将这部分缺失补齐。另外,同一变量来自不同子库缺失值状况可能不同,比如学历程度,这也需要相互补齐,生成一个缺失值最少的变量。
2.教育背景缺失值填充:对于固定的变量或能够建立对应关系的变量(比如同一公司同一年的行业)都很容易相互补充缺失值。但学历稍有不同,因为它可能发生改变,比如一个高管2008年是硕士,2009-2012年的学历是缺失的,2013年开始就是博士了,如果假定2013年是博士的第一年,2009-2012就应该将缺失值填充为硕士。因为一个人的学历只会上升或不变,但不会下降。
附件内容(购买链接见本贴末尾):
1.董监高个人特征数据(GTAperson2023)
(1)org文件夹:原始数据文件夹
(2)out文件夹:处理过程中生成的 dta 文件
(3)xls文件夹:原始数据解压后的 excel 文件
(4)GTAperson2023.do:数据处理 do 文件
(5)GTAperson2023-1.dta:董监高个人特征最终数据1 dta 格式
(6)GTAperson2023-2.dta:董监高个人特征最终数据2 dta 格式
注意:大家购买前可先免费下载变量说明和样本数据
各年度观测值:
(1)数据1
| 年份 | Freq. | Percent | Cum. |
| 1990 | 10 | 0 | 0 |
| 1991 | 8 | 0 | 0 |
| 1992 | 481 | 0.04 | 0.04 |
| 1993 | 1,739 | 0.15 | 0.19 |
| 1994 | 1,672 | 0.14 | 0.33 |
| 1995 | 376 | 0.03 | 0.36 |
| 1996 | 3,147 | 0.27 | 0.63 |
| 1997 | 3,252 | 0.28 | 0.91 |
| 1998 | 1,734 | 0.15 | 1.06 |
| 1999 | 17,235 | 1.47 | 2.52 |
| 2000 | 20,449 | 1.74 | 4.26 |
| 2001 | 21,273 | 1.81 | 6.07 |
| 2002 | 23,387 | 1.99 | 8.06 |
| 2003 | 24,750 | 2.11 | 10.17 |
| 2004 | 27,012 | 2.3 | 12.47 |
| 2005 | 25,060 | 2.13 | 14.6 |
| 2006 | 27,163 | 2.31 | 16.91 |
| 2007 | 30,499 | 2.59 | 19.5 |
| 2008 | 31,547 | 2.68 | 22.19 |
| 2009 | 34,107 | 2.9 | 25.09 |
| 2010 | 44,555 | 3.79 | 28.88 |
| 2011 | 48,922 | 4.16 | 33.04 |
| 2012 | 50,502 | 4.3 | 37.34 |
| 2013 | 49,566 | 4.22 | 41.56 |
| 2014 | 54,735 | 4.66 | 46.22 |
| 2015 | 58,990 | 5.02 | 51.23 |
| 2016 | 64,014 | 5.45 | 56.68 |
| 2017 | 73,838 | 6.28 | 62.96 |
| 2018 | 70,047 | 5.96 | 68.92 |
| 2019 | 75,440 | 6.42 | 75.34 |
| 2020 | 86,601 | 7.37 | 82.71 |
| 2021 | 96,837 | 8.24 | 90.95 |
| 2022 | 101,589 | 8.64 | 99.59 |
| 2023 | 4,792 | 0.41 | 100 |
| Total | 1,175,329 | 100 |
(2)数据2
| 年份 | Freq. | Percent | Cum. |
| 1990 | 9 | 0 | 0 |
| 1991 | 9 | 0 | 0 |
| 1992 | 21 | 0 | 0 |
| 1993 | 128 | 0 | 0.01 |
| 1994 | 161 | 0 | 0.01 |
| 1995 | 199 | 0.01 | 0.02 |
| 1996 | 1,157 | 0.04 | 0.05 |
| 1997 | 4,733 | 0.15 | 0.2 |
| 1998 | 8,918 | 0.28 | 0.48 |
| 1999 | 17,294 | 0.54 | 1.01 |
| 2000 | 24,183 | 0.75 | 1.76 |
| 2001 | 28,792 | 0.89 | 2.66 |
| 2002 | 36,682 | 1.14 | 3.8 |
| 2003 | 42,116 | 1.31 | 5.1 |
| 2004 | 48,163 | 1.5 | 6.6 |
| 2005 | 53,980 | 1.68 | 8.28 |
| 2006 | 60,110 | 1.87 | 10.14 |
| 2007 | 72,004 | 2.24 | 12.38 |
| 2008 | 83,458 | 2.59 | 14.97 |
| 2009 | 94,187 | 2.92 | 17.89 |
| 2010 | 106,601 | 3.31 | 21.2 |
| 2011 | 117,230 | 3.64 | 24.84 |
| 2012 | 126,917 | 3.94 | 28.78 |
| 2013 | 139,847 | 4.34 | 33.12 |
| 2014 | 160,310 | 4.98 | 38.1 |
| 2015 | 182,159 | 5.65 | 43.75 |
| 2016 | 201,064 | 6.24 | 49.99 |
| 2017 | 219,088 | 6.8 | 56.8 |
| 2018 | 237,914 | 7.39 | 64.18 |
| 2019 | 258,328 | 8.02 | 72.2 |
| 2020 | 280,289 | 8.7 | 80.9 |
| 2021 | 299,254 | 9.29 | 90.19 |
| 2022 | 315,950 | 9.81 | 100 |
| Total | 3,221,277 | 100 |
数据代码展示:
变量说明+样本数据
(76 Bytes)
【更新至2023】1990-2023高管(董监高)个人特征数据(代码+数据 300万+)
(76 Bytes, 需要: RMB 68 元)
【更多帖子链接】:点击此处


雷达卡




精品数据集集锦2023:
京公网安备 11010802022788号







