变量数:第一层数据8个;第二层数据15个
观测值数量:411795
爬虫软件:Stata16
数据来源:新浪财经
链接示例(以万科000002为例):
https://vip.stock.finance.sina.com.cn/corp/go.php/vCI_CorpManager/stockid/000002.phtml
补充说明:附件包含内容如下
1.out文件夹:爬取过程生成的 dta 文件(已删除可忽略)
2.process文件夹:爬取第一层数据过程中生成的相关文件(已删除可忽略)
3.process2文件夹:爬取第二层数据过程中生成的相关文件(已删除可忽略)
4.爬虫代码-高管特征2020.do:Stata爬虫代码do文件(重要!)
5.上市公司全部高管列表(第一层数据).dta:第一层高管数据
6.上市公司全部高管列表(第一层数据).xlsx:第一层高管数据
7.上市公司高管特征数据(第二层数据).dta:第二层高管数据(含高管简历 重要!)
8.上市公司高管特征数据(第二层数据).xlsx:第二层高管数据(含高管简历 重要!)
大家可以先下载查看示例数据(免费!)
变量说明:
| 序号 | 变量 |
| 1 | 链接 |
| 2 | 证券代码 |
| 3 | 人员代码 |
| 4 | 姓名 |
| 5 | 任职公司股票代码 |
| 6 | 任职公司名称 |
| 7 | 职务 |
| 8 | 任职日期 |
| 9 | 离职日期 |
| 10 | 报酬 |
| 11 | 性别 |
| 12 | 出生日期 |
| 13 | 学历 |
| 14 | 国籍 |
| 15 | 简历 |
变量缺失值情况:
| Variable | Missing | Total | Percent Missing |
| http | 0 | 411,795 | 0 |
| Stkcd | 0 | 411,795 | 0 |
| personID | 0 | 411,795 | 0 |
| 姓名 | 10 | 411,795 | 0 |
| 任职公司 代码 | 132 | 411,795 | 0.03 |
| 任职公司 名称 | 111 | 411,795 | 0.03 |
| 职务 | 89 | 411,795 | 0.02 |
| 任职日期 | 597 | 411,795 | 0.14 |
| 离职日期 | 33,038 | 411,795 | 8.02 |
| 报酬 | 110,607 | 411,795 | 26.86 |
| 性别 | 0 | 411,795 | 0 |
| 出生日期 | 2,518 | 411,795 | 0.61 |
| 学历 | 26,416 | 411,795 | 6.41 |
| 国籍 | 70,330 | 411,795 | 17.08 |
| 简历 | 0 | 411,795 | 0 |
代码及数据截图:
示例数据-抽样5%.xlsx
(4.54 MB)
示例数据-抽样5%.dta
(19.12 MB)
1990-2020上市公司高管个人特征及简历数据(含代码)
(76 Bytes, 需要: RMB 68 元)


雷达卡




精品数据集集锦:


京公网安备 11010802022788号







