本数据集涵盖2004年至2024年中国A股上市公司CEO绿色经历的完整信息。数据包含6万余个样本观测值,覆盖5600余家上市企业,其中包含2000余个非零有效值。需要说明的是,并非所有高管均具有绿色经历,这是正常现象,符合实际情况。
二、理论基础与文献依据
本数据的测量方法参考权威C刊《经济管理》发表的研究成果。具体而言,卢建词和姜广省(2022)在其论文"CEO绿色经历能否促进企业绿色创新?"中系统阐述了CEO绿色经历的识别方法与测量标准。该研究为本数据集的构建提供了坚实的理论基础和方法论指导。
参考文献:
卢建词,姜广省.CEO绿色经历能否促进企业绿色创新?[J].经济管理,2022,44(02):106-121.DOI:10.19616/j.cnki.bmj.2022.02.007.
三、变量定义与测量方法
(一)分析对象
本研究选取上市公司CEO作为核心分析对象。CEO的界定包括但不限于:首席执行官、总经理、执行总经理、常务副总经理等实际负责公司运营的高级管理人员。
(二)绿色经历的识别
绿色经历是指CEO在其职业生涯或教育背景中与环境保护、绿色发展相关的经历。具体识别方法如下:
1. 数据来源
从权威数据库中获取高管个人简历数据,包含详细的教育背景、工作经历等信息。
2. 识别标准
通过文本挖掘方法,在CEO个人简历中检索以下绿色相关关键词:
- 教育类:环境工程、环境科学、环境专业
- 行业类:制浆造纸、企业污染防治
- 机构类:环保部、环境保护部、环保委员会
- 通用类:绿色、环保、污染防治、污染、环境
3. 双重识别机制
为确保识别的准确性和全面性,本数据采用双重识别机制:
(1)结构化识别:基于数据库中的职位代码(PositionID)字段,精确识别CEO职位;
(2)文本识别:通过正则表达式在简历文本中检索"现任总经理""担任CEO"等关键表述,补充识别遗漏样本。
(三)变量赋值规则
Green变量为二值虚拟变量:
- Green = 1:企业CEO具有绿色经历,即其个人简历中包含上述任一绿色关键词;
- Green = 0:企业CEO不具有绿色经历,即其个人简历中未包含任何绿色关键词。
(四)数据结构
本数据采用"公司-年度"面板数据结构。对于同一公司同一年度存在多位CEO的情况,采用以下处理原则:若该公司该年度至少有一位CEO具有绿色经历,则该公司该年度的Green变量取值为1;否则取值为0。
四、数据处理流程
(一)原始数据准备
从权威数据库导入高管个人资料数据,包含证券代码、统计截止日期、人员ID、职位ID、个人简历等字段。
(二)数据清洗
1. 提取年份信息:从统计截止日期字段中提取年份;
2. 变量格式转换:将股票代码、年份等变量转换为数值型;
3. 缺失值处理:删除简历信息为空的观测值。
(三)CEO职位识别
采用双重识别机制:
1. 基于职位代码识别:筛选PositionID为P35302(首席执行官)、P35303(总经理)、P35306(执行总经理)、P35307(常务副总经理)的样本;
2. 基于简历文本识别:在简历中检索"现任总经理""担任CEO""任公司总经理"等关键表述。
(四)绿色经历识别
对已识别的CEO样本,在其个人简历中检索绿色相关关键词。若匹配成功,则将该CEO标记为具有绿色经历。
(五)数据汇总与去重
按公司-年度进行数据汇总,生成公司层面的Green变量。删除重复观测值,确保每个公司每年仅有一条记录。
(六)结果输出
生成Stata格式数据文件(.dta)和Excel格式数据文件(.xlsx),便于后续统计分析使用。
五、数据文件清单
本数据集包含以下文件:
1. 原始数据.dta:权威高管个人资料原始数据
2. 原始数据_add.dta:补充的更详细的CEO简历数据
3. CEO绿色经历.do:完整的数据处理代码(Stata)
4. trans.do:简历信息更新脚本
5. CEO绿色经历.dta:处理后的最终数据(Stata格式)
6. CEO绿色经历.xlsx:处理后的最终数据(Excel格式)
六、变量说明
最终数据文件包含以下主要变量:
1. Stkcd:证券代码(6位数字)
2. year:年份(2004-2024)
3. Green:CEO绿色经历虚拟变量(0或1)
4. 其他辅助变量:根据具体需求保留的相关信息
七、数据质量控制
(一)识别准确性
通过双重识别机制,最大程度确保CEO职位识别的准确性。程序运行时会输出详细的识别统计信息,研究者可据此评估识别效果。
(二)关键词覆盖性
绿色关键词列表经过文献梳理和专家论证,涵盖教育、行业、机构等多个维度,确保识别的全面性。
(三)可复现性
本数据集提供完整的Stata代码,所有数据处理步骤均可追溯和复现,确保研究的透明性和可验证性。
(四)数据验证
研究者可通过以下方式验证数据准确性:
1. 运行提供的Stata代码,对比计算结果;
2. 抽样检查具体公司具体年份的Green取值;
3. 查看程序输出的统计信息,评估数据质量。
八、使用建议
(一)适用研究领域
本数据适用于但不限于以下研究主题:
1. CEO绿色经历与企业绿色创新
2. 高管环境意识与企业环境绩效
3. 高管背景特征与企业战略选择
4. 企业社会责任与可持续发展
(二)数据匹配
本数据采用标准的证券代码(Stkcd)和年份(year)作为匹配键,可与其他上市公司数据库(如权威、万得、锐思等)便捷匹配。
(三)注意事项
1. 本数据仅包含CEO绿色经历信息,若需其他高管信息,需对代码进行相应调整;
2. Green变量为公司-年度层面变量,反映的是该公司该年度CEO是否具有绿色经历;
3. 绿色经历的识别基于简历文本信息,可能存在一定的测量误差;
4. 建议研究者在使用前仔细阅读参考文献,理解变量的理论内涵和测量方法。
九、技术支持
(一)代码说明
提供的Stata代码包含详细的中文注释,每个步骤均有说明。代码结构清晰,便于理解和修改。
(二)数据更新
若需更新至最新年份,只需获取最新的高管个人资料数据,运行相同的处理代码即可。
(三)问题反馈
使用过程中如遇到技术问题或发现数据疑问,建议:
1. 仔细阅读代码注释,理解数据处理逻辑;
2. 检查原始数据的完整性和准确性;
3. 参考卢建词等(2022)的原文,对照测量方法。
附录:关键词列表
本数据集使用的绿色关键词完整列表如下:
1. 制浆造纸
2. 环境
3. 环境工程
4. 环境科学
5. 环保部
6. 环境保护部
7. 环保委员会
8. 企业污染防治
9. 绿色
10. 环保
11. 污染防治
12. 污染
研究者可根据具体研究需求,在代码中调整关键词列表。
【数据】上市公司企业CEO绿色经历数据、高管绿色经历数据 2024-2004年
(76 Bytes, 需要: RMB 32 元)


雷达卡



京公网安备 11010802022788号







