更新时间:2023年9月25日
处理软件:Stata16
观测值数量:
(1)1175329(董监高个人特征1-变量说明及缺失值情况详见附件“说明”-免费下载)
(2)3221277(董监高个人特征2-变量说明及缺失值情况详见附件“说明”-免费下载)
楼主提示:数据处理难点如下:
1.相同变量填补缺失值:同一个人同一个变量可能有不同的缺失值,比如某高管年龄或性别在公司A的观测值中不存在缺失,但在公司B(可能存在兼职)可能是缺失的,需将这部分缺失补齐。另外,同一变量来自不同子库缺失值状况可能不同,比如学历程度,这也需要相互补齐,生成一个缺失值最少的变量。
2.教育背景缺失值填充:对于固定的变量或能够建立对应关系的变量(比如同一公司同一年的行业)都很容易相互补充缺失值。但学历稍有不同,因为它可能发生改变,比如一个高管2008年是硕士,2009-2012年的学历是缺失的,2013年开始就是博士了,如果假定2013年是博士的第一年,2009-2012就应该将缺失值填充为硕士。因为一个人的学历只会上升或不变,但不会下降。
附件内容(购买链接见本贴末尾):
1.董监高个人特征数据(GTAperson2022)
(1)org文件夹:原始数据文件夹
(2)out文件夹:处理过程中生成的 dta 文件
(3)xls文件夹:原始数据解压后的 excel 文件
(4)GTAperson2022.do:数据处理 do 文件
(5)GTAperson2022-1.dta:董监高个人特征最终数据1 dta 格式
(6)GTAperson2022-2.dta:董监高个人特征最终数据2 dta 格式
注意:大家购买前可先免费下载变量说明(新增职业分类变量)和样本数据
各年度观测值: