更新时间:2023年7月14日
处理软件:Stata16
样本区间:1990-2022
观测值:177万+
数据说明:本数据为1990-2022某浪财经高管个人特征数据,这套数据是目前比较全面的高管个人特征数据,之前也是很多小伙伴私信询问我更新的情况,我最近花了大概一周的时间爬了整套数据。本数据合并起来的数据最终包含177万+的观测值,公司包括沪深两市上市公司,共4930家。由于excel无法承载这么大的文件,我就拆成了两个文件,同时我也提供了dta格式的数据,方便后续使用Stata进行实证研究,dta格式的数据可以承载这个数据规模,当然如果电脑内存不太够的话,打开也是需要一段时间的。附件采用百度网盘链接形式。
附件包含内容:
1.out文件夹——每一家上市公司历届高管个人特征及任职数据(共4930家);
2.1990-2022上市公司高管数据1.xlsx——excel格式最终数据1;
3.1990-2022上市公司高管数据2.xlsx——excel格式最终数据2;
4.1990-2022上市公司高管数据.dta——dta格式最终数据(推荐使用);
5.高管爬虫代码.py——python爬虫代码;
6.文件合并代码.py——4090个excel合并代码
包含变量说明:股票代码 姓名 性别 出生日期 教育背景 国籍 简历 公司名称 职务 任职起始日期 任职终止日期
变量缺失值情况:
Variable | Missing | Total | Percent Missing |
股票代码 | 0 | 1,770,971 | 0 |
姓名 | 18 | 1,770,971 | 0 |
性别 | 0 | 1,770,971 | 0 |
出生日期 | 5,461 | 1,770,971 | 0.31 |
教育背景 | 0 | 1,770,971 | 0 |
国籍 | 253,616 | 1,770,971 | 14.32 |
简历 | 0 | 1,770,971 | 0 |
公司名称 | 0 | 1,770,971 | 0 |
职务 | 0 | 1,770,971 | 0 |
任职起始日期 | 0 | 1,770,971 | 0 |
任职终止日期 | 0 | 1,770,971 | 0 |
数据代码展示: