更新时间:2023年9月25日
处理软件:Stata16
样本区间:1996-2022
观测值:148万+
数据说明:本数据为某浪财经董监高个人特征扩展数据,高管个人特征数据及爬虫代码已经发帖,但很多小伙伴想处理成每一家公司每个年度的董监高数据,这里就需要根据高管的任职起始年度,对数据进行扩展,并剔除重复观测值;同时,对于性别、出生地等不随时间改变的变量,可以利用同一董监高的其他观测值补全缺失值,当然,也有一些变量,如教育背景、国籍等,尽管可能随时间发生改变,但改变的可能性并不高,也可以酌情按照上述方法进行处理。本贴主要是分享处理后的董监高数据,方便大家直接使用,附件除了数据,提供了完整的Stata处理过程do文件,供大家参考。由于数据量较大,附件数据为dta格式,可使用Stata16及以上版本打开。
附件包含内容:
1.org:原始数据文件夹——包含原始的董监高个人特征数据;
2.out:处理过程文件夹(可忽略);
3.上市公司高管数据(处理后).dta——处理结果数据(可直接使用);
4.高管数据处理.do——处理过程do文件
变量缺失值情况:
Variable | Missing | Total | Percent Missing |
股票代码 | 0 | 1,486,075 | 0 |
股票代码str | 0 | 1,486,075 | 0 |
任职年度 | 0 | 1,486,075 | 0 |
姓名 | 0 | 1,486,075 | 0 |
性别 | 0 | 1,486,075 | 0 |
出生日期 | 3,496 | 1,486,075 | 0.24 |
教育背景 | 0 | 1,486,075 | 0 |
国籍 | 166,310 | 1,486,075 | 11.19 |
简历 | 0 | 1,486,075 | 0 |
公司名称 | 0 | 1,486,075 | 0 |
职务 | 0 | 1,486,075 | 0 |
任职起始日期 | 0 | 1,486,075 | 0 |
年度观测值数量:
年度 | Freq. | Percent | Cum. |
1996 | 3 | 0 | 0 |
1997 | 5 | 0 | 0 |
1998 | 7 | 0 | 0 |
1999 | 58 | 0 | 0 |
2000 | 168 | 0.01 | 0.02 |
2001 | 622 | 0.04 | 0.06 |
2002 | 8,940 | 0.6 | 0.66 |
2003 | 21,494 | 1.45 | 2.11 |
2004 | 33,787 | 2.27 | 4.38 |
2005 | 42,826 | 2.88 | 7.26 |
2006 | 44,080 | 2.97 | 10.23 |
2007 | 47,428 | 3.19 | 13.42 |
2008 | 50,287 | 3.38 | 16.8 |
2009 | 50,592 | 3.4 | 20.21 |
2010 | 55,538 | 3.74 | 23.94 |
2011 | 58,350 | 3.93 | 27.87 |
2012 | 59,614 | 4.01 | 31.88 |
2013 | 64,807 | 4.36 | 36.24 |
2014 | 73,773 | 4.96 | 41.21 |
2015 | 81,531 | 5.49 | 46.69 |
2016 | 88,519 | 5.96 | 52.65 |
2017 | 94,288 | 6.34 | 59 |
2018 | 98,828 | 6.65 | 65.65 |
2019 | 109,083 | 7.34 | 72.99 |
2020 | 123,273 | 8.3 | 81.28 |
2021 | 135,558 | 9.12 | 90.4 |
2022 | 142,616 | 9.6 | 100 |
Total | 1,486,075 | 100 |
数据代码展示: