更新时间:2024年7月3日
处理软件:Stata16
样本区间:1996-2023
观测值:148万+
数据说明:本数据为1996-2023某浪财经董监高个人特征扩展数据,高管个人特征数据及爬虫代码已经同步发帖,但很多小伙伴想处理成每一家公司每个年度的董监高数据,这里就需要根据高管的任职起始年度,对数据进行扩展,并剔除重复观测值;同时,对于性别、出生地等不随时间改变的变量,可以利用同一董监高的其他观测值补全缺失值,当然,也有一些变量,如教育背景、国籍等,尽管可能随时间发生改变,但改变的可能性并不高,也可以酌情按照上述方法进行处理。本贴主要是分享处理后的董监高数据,方便大家直接使用,附件除了数据,提供了完整的Stata处理过程do文件,供大家参考。由于数据量较大,附件数据为dta格式,可使用Stata16及以上版本打开。
附件包含内容:
1.org:原始数据文件夹——包含原始的董监高个人特征数据;
2.out:处理过程文件夹(可忽略);
3.上市公司高管数据(处理后).dta——处理结果数据(可直接使用);
4.高管数据处理.do——处理过程do文件
变量缺失值情况:
| Variable | Missing | Total | Percent Missing |
| 股票代码 | 0 | 1,844,997 | 0 |
| 股票代码str | 0 | 1,844,997 | 0 |
| 任职年度 | 0 | 1,844,997 | 0 |
| 姓名 | 0 | 1,844,997 | 0 |
| 性别 | 0 | 1,844,997 | 0 |
| 出生日期 | 6,773 | 1,844,997 | 0.37 |
| 教育背景 | 0 | 1,844,997 | 0 |
| 国籍 | 247,671 | 1,844,997 | 13.42 |
| 简历 | 0 | 1,844,997 | 0 |
| 公司名称 | 0 | 1,844,997 | 0 |
| 职务 | 0 | 1,844,997 | 0 |
| 任职起始日期 | 0 | 1,844,997 | 0 |
| 任职终止日期 | 21,201 | 1,844,997 | 1.15 |
年度观测值数量:
| 年度 | Freq. | Percent | Cum. |
| 1996 | 3 | 0 | 0 |
| 1997 | 5 | 0 | 0 |
| 1998 | 7 | 0 | 0 |
| 1999 | 58 | 0 | 0 |
| 2000 | 168 | 0.01 | 0.01 |
| 2001 | 618 | 0.03 | 0.05 |
| 2002 | 8,700 | 0.47 | 0.52 |
| 2003 | 20,999 | 1.14 | 1.66 |
| 2004 | 32,865 | 1.78 | 3.44 |
| 2005 | 41,686 | 2.26 | 5.7 |
| 2006 | 42,907 | 2.33 | 8.02 |
| 2007 | 46,235 | 2.51 | 10.53 |
| 2008 | 49,036 | 2.66 | 13.19 |
| 2009 | 49,272 | 2.67 | 15.86 |
| 2010 | 54,200 | 2.94 | 18.79 |
| 2011 | 57,015 | 3.09 | 21.88 |
| 2012 | 58,471 | 3.17 | 25.05 |
| 2013 | 64,033 | 3.47 | 28.52 |
| 2014 | 73,640 | 3.99 | 32.52 |
| 2015 | 83,217 | 4.51 | 37.03 |
| 2016 | 91,091 | 4.94 | 41.96 |
| 2017 | 97,353 | 5.28 | 47.24 |
| 2018 | 102,544 | 5.56 | 52.8 |
| 2019 | 113,762 | 6.17 | 58.96 |
| 2020 | 139,591 | 7.57 | 66.53 |
| 2021 | 172,992 | 9.38 | 75.91 |
| 2022 | 205,112 | 11.12 | 87.02 |
| 2023 | 239,417 | 12.98 | 100 |
| Total | 1,844,997 | 100 |
数据代码展示:
【更新至2023】某浪财经董监高个人特征扩展数据(184万+观测值 含代码)
(76 Bytes, 需要: RMB 68 元)
【更多帖子链接】:点击此处


雷达卡




精品数据集集锦2023:

京公网安备 11010802022788号







