本数据集基于中国A股上市公司独立董事会议出席记录,计算了五个核心的独立董事
履职行为指标。数据涵盖2004-2024年中国A股上市公司,综合反映了上市公司独立
董事的参会积极性、委托参会情况以及勤勉尽责程度,可用于研究上市公司独立董事
履职行为对公司治理效果、经营业绩和市场表现的影响。
二、核心指标说明
【指标1】独董平均亲自参会率(AATT - Average Attendance)
定义:上市公司所有独立董事亲自参会率的平均值
计算方法:
第一步:计算每位独立董事的个人亲自参会率 = 亲自出席次数/应参加总数
第二步:对该上市公司所有独立董事求平均值
取值范围:[0, 1],连续变量
研究意义:反映上市公司独立董事整体参会积极性,数值越大表示独立董事越积极
参与公司会议,履职更加主动
【指标2】独董平均委托参会率(PATT - Proxy Attendance)
定义:上市公司所有独立董事委托参会率的平均值
计算方法:
第一步:计算每位独立董事的个人委托参会率 = 委托出席次数/应参加总数
第二步:对该上市公司所有独立董事求平均值
取值范围:[0, 1],连续变量
研究意义:反映上市公司独立董事委托他人参会的普遍程度,数值越大表示独立董事
委托参会越频繁,可能存在履职不充分的问题
【指标3】独董最小亲自参会率(MATT - Minimum Attendance)
定义:上市公司所有独立董事亲自参会率的最小值
计算方法:
第一步:计算每位独立董事的个人亲自参会率 = 亲自出席次数/应参加总数
第二步:取该上市公司所有独立董事的最小值
取值范围:[0, 1],连续变量
研究意义:识别上市公司中参会最不积极的独立董事表现,可用于检测是否存在
"挂名独董"问题。数值越低表示至少有一位独立董事参会很不积极
【指标4】独董最大委托参会率(MPATT - Maximum Proxy Attendance)
定义:上市公司所有独立董事委托参会率的最大值
计算方法:
第一步:计算每位独立董事的个人委托参会率 = 委托出席次数/应参加总数
第二步:取该上市公司所有独立董事的最大值
取值范围:[0, 1],连续变量
研究意义:识别上市公司中委托参会最频繁的独立董事表现,可用于检测是否存在
严重的履职缺位问题。数值越高表示至少有一位独立董事经常委托参会
【指标5】独董是否勤勉(ATT - Attendance Threshold)★核心指标★
定义:上市公司所有独立董事是否均达到勤勉尽责标准的二元变量
计算方法:
第一步:计算MATT(最小亲自参会率)
第二步:若MATT > 2/3,则ATT = 1;否则ATT = 0
取值范围:{0, 1},二元变量
- ATT = 1:上市公司所有独立董事参会率均超过2/3,整体勤勉尽责
- ATT = 0:上市公司至少有一位独立董事参会率≤2/3,存在履职不足
理论依据:2/3阈值参考《上市公司治理准则》对董事履职的要求
研究意义:该指标可直接用于识别上市公司独立董事整体履职质量,适用于
二元选择模型(Logit/Probit)和倾向得分匹配(PSM)分析
三、数据文件结构
【原始数据文件】
1. 上市公司独立董事履职会议数据.dta
- 包含每位独立董事的会议出席记录
- 字段:证券代码、年份、独立董事姓名、应参加会议总数、亲自出席次数、
委托出席次数等
2. 上市公司行业与地区信息数据.dta
- 包含上市公司基本信息
- 字段:证券代码、证券简称、行业代码、行业名称、所属省份、所属城市等
【计算结果文件(三个版本)】
版本1:计算结果未剔除金融STPT版本.dta / .xlsx
适用场景:需要全样本分析的研究
样本范围:保留所有A股上市公司(剔除B股)
数据处理:未进行行业剔除和极端值处理
推荐用途:描述性统计、全市场分析、行业对比研究
版本2:计算结果已剔除金融STPT未缩尾版本.dta / .xlsx
适用场景:一般实证研究的主回归分析
样本范围:剔除金融业(行业代码含"J")和ST、PT等特殊处理上市公司
数据处理:剔除异常样本,但保留原始数据分布
推荐用途:主回归分析、机制检验、异质性分析
版本3:计算结果已剔除金融STPT已缩尾版本.dta / .xlsx
适用场景:稳健性检验和对极端值敏感的分析
样本范围:同版本2
数据处理:在版本2基础上,对AATT、PATT、MATT、MPATT、ATT五个指标
按年度进行前后1%缩尾处理
推荐用途:稳健性检验、减少极端值影响的回归分析
【代码文件】
1. 上市公司独立董事履职行为数据计算代码.do(Stata版本)
- 兼容Stata 15及以上版本
- 使用UTF-8编码
- 包含详细注释,注释占比超过40%
2. 上市公司独立董事履职行为数据计算代码.py(Python版本)
- 需要pandas、numpy库
- 与Stata版本逻辑完全一致
- 适用于Python数据分析环境
3. 上市公司独立董事履职行为数据评估代码.do / .py
- 自动化数据质量评估
- 生成"评估结果"文件夹,包含:
· 数据分布分析(描述性统计、分年度/行业/地区统计)
· 分布图(直方图、核密度图、箱线图、年度趋势图等)
· 异常值检验(合理范围检测、3倍标准差法、IQR方法)
· 逻辑合理性验证(MATT≤AATT、MPATT≥PATT、ATT与MATT一致性等)
· 稳健性测试(不同版本对比、缩尾前后对比、分行业/地区稳定性)
四、变量详细说明
【基础标识变量】
变量名 | 类型 | 说明
--------------|--------|-----------------------------------------------
证券代码 | 字符串 | 上市公司6位证券代码(如"000001")
证券简称 | 字符串 | 上市公司简称(如"平安银行")
stkcd | 数值 | 证券代码的数值形式
year | 数值 | 年份(2004-2024)
【核心指标变量】
变量名 | 类型 | 取值范围 | 说明
--------------|--------|---------|---------------------------------------
AATT | 数值 | [0, 1] | 独董平均亲自参会率
PATT | 数值 | [0, 1] | 独董平均委托参会率
MATT | 数值 | [0, 1] | 独董最小亲自参会率
MPATT | 数值 | [0, 1] | 独董最大委托参会率
ATT | 0/1 | {0, 1} | 独董是否勤勉(1=勤勉)
【行业与地区变量】
变量名 | 类型 | 说明
--------------|--------|-----------------------------------------------
行业代码 | 字符串 | 证监会行业分类代码
行业名称 | 字符串 | 上市公司所属行业名称
所属省份 | 字符串 | 上市公司注册地省份
所属省份代码 | 字符串 | 省份代码
所属城市 | 字符串 | 上市公司注册地城市
所属城市代码 | 字符串 | 城市代码
五、数据样本说明
【时间跨度】2004-2024年(21年)
【样本范围】
- 基础样本:中国A股上市公司
- 剔除样本:
· B股(证券代码以2或9开头)
· 金融业(行业代码包含"J",仅在版本2和版本3中剔除)
· ST、PT等特殊处理上市公司(仅在版本2和版本3中剔除)
【数据特征】
- 数据结构:非平衡面板数据(Unbalanced Panel Data)
- 观测频率:年度数据
- 缺失值处理:无独立董事会议记录的上市公司-年份观测值已被剔除
【样本量参考】(具体样本量根据实际数据可能有所不同)
- 版本1(未剔除):约40,000+观测值
- 版本2(已剔除):约35,000+观测值
- 版本3(已缩尾):与版本2样本量相同,但数值分布有调整
【指标相关性】
根据数据评估结果,五个指标间存在预期的相关性:
- AATT与PATT:强负相关(r ≈ -0.92)- 亲自参会多则委托少
- AATT与MATT:强正相关(r ≈ 0.90)- 平均值与最小值同向变动
- PATT与MPATT:强正相关(r ≈ 0.90)- 平均值与最大值同向变动
- ATT与MATT:较强正相关(r ≈ 0.76)- 勤勉度与最小参会率正相关
六、数据质量说明
【数据来源质量】
- 原始数据来源于上市公司年报披露的独立董事会议出席记录
- 数据符合中国证监会信息披露要求
- 行业与地区信息来自主流金融数据库
【计算准确性】
- 指标计算基于成熟的公司治理研究方法
- 代码经过严格测试和逻辑验证
- 提供Stata和Python双语言版本,可交叉验证
- 附带完整的数据质量评估报告
【数据完整性】
- 保留了上市公司基础信息(代码、简称、行业、地区)
- 提供三个版本数据,满足不同研究需求
- 附带完整的计算代码和评估代码,可追溯和复现
【逻辑合理性】
根据评估代码检验,数据满足以下逻辑关系:
1. MATT ≤ AATT(最小值≤平均值)
2. MPATT ≥ PATT(最大值≥平均值)
3. AATT + PATT ≤ 1(亲自+委托≤总会议)
4. ATT=1 ⟺ MATT>2/3(勤勉标准与最小参会率一致)
【异常值处理】
- 版本1和版本2:保留原始数据分布,所有指标值在[0,1]合理范围内
- 版本3:对五个指标按年度进行1%缩尾处理
- 详细的异常值检验报告见"评估结果/异常值检验"文件夹
七、使用建议
【研究设计建议】
1. 主回归分析:建议使用版本2(已剔除金融STPT未缩尾版本)
- 剔除了金融业和异常样本,符合常规实证研究惯例
- 保留了原始数据分布,便于经济意义解释
- 适用于研究独立董事履职对上市公司业绩、风险等的影响
2. 稳健性检验:建议使用版本3(已剔除金融STPT已缩尾版本)
- 可用于检验极端值对回归结果的影响
- 也可作为主回归的替代方案
3. 全样本分析:建议使用版本1(未剔除金融STPT未缩尾版本)
- 适用于需要包含金融业的研究
- 适用于行业对比研究(如比较金融业与非金融业独董履职差异)
【实证模型建议】
1. 固定效应模型(Fixed Effects Model)
- 控制上市公司个体固定效应和年份固定效应
- 代码示例(Stata):
xtreg Y AATT 控制变量, fe vce(cluster stkcd)
- 适用于研究独立董事履职对连续型因变量的影响
2. 双向固定效应模型(Two-way Fixed Effects)
- 控制上市公司固定效应和年份固定效应
- 代码示例(Stata):
reghdfe Y AATT 控制变量, absorb(stkcd year) vce(cluster stkcd)
- 适用于大样本面板数据分析
3. Logit/Probit模型
- 使用ATT作为自变量或因变量
- 代码示例(Stata):
logit Y ATT 控制变量, vce(cluster stkcd)
- 适用于研究独立董事勤勉度的影响或决定因素
4. 倾向得分匹配(PSM)
- 使用ATT作为处理变量
- 比较勤勉(ATT=1)和不勤勉(ATT=0)的上市公司
- 代码示例(Stata):
psmatch2 ATT 控制变量, outcome(Y) ate
【控制变量建议】
1. 上市公司层面:
- 企业规模(资产总额、营业收入的对数)
- 盈利能力(ROA、ROE)
- 成长能力(营收增长率、托宾Q)
- 财务杠杆(资产负债率)
- 股权结构(第一大股东持股比例、股权制衡度)
- 企业年龄(上市年限、成立年限)
- 董事会特征(董事会规模、独立董事比例)
2. 独立董事特征(如果数据可得):
- 独立董事背景(学术型、政府型、商业型)
- 独立董事任期
- 独立董事薪酬
- 独立董事兼职数量
3. 公司治理层面:
- 两职合一(董事长与总经理是否同一人)
- 管理层持股比例
- 机构投资者持股比例
4. 行业与宏观层面:
- 行业竞争度
- 行业固定效应
- GDP增长率
- 年份固定效应
【注意事项】
1. 指标选择:
- AATT和MATT最常用,分别反映平均水平和最差情况
- ATT适用于二元分析和分组比较
- 可同时使用多个指标进行稳健性检验
2. 内生性问题:
- 独立董事履职可能与公司业绩存在双向因果关系
- 建议使用工具变量(IV)或系统GMM方法
- 可考虑使用省份平均独董参会率作为工具变量
- 可使用滞后变量减轻内生性
3. 异质性分析:
- 可按行业、地区、企业规模、所有制性质等进行分组回归
- 可使用交互项检验调节效应
- 建议关注国有企业与非国有企业的差异
4. 稳健性检验:
- 更换核心解释变量(如用MATT替代AATT)
- 更换样本区间(排除特殊年份如金融危机期间)
- 更换模型设定(如使用Tobit模型处理截断数据)
- 使用版本3的缩尾数据
八、参考文献
本数据的理论基础和计算方法参考以下文献:
[1] 史春玲. (2019). 独立董事出席会议与发表意见:合规性履职还是有效性履职.
管理评论, 31(11), 204-216.
(独立董事履职行为测度的经典文献)
[2] 史春玲. (2020). 董事高管责任保险与独立董事履职行为研究.
金融研究, (7), 170-188.
(独立董事履职行为影响因素研究)
[3] Fama, E. F., & Jensen, M. C. (1983). Separation of ownership and control.
The Journal of Law and Economics, 26(2), 301-325.
(公司治理理论基础)
[4] Adams, R. B., & Ferreira, D. (2009). Women in the boardroom and their
impact on governance and performance. Journal of Financial Economics,
94(2), 291-309.
(董事会出席率与公司治理研究)
[5] 配套参考文献:
详见本文件夹中的PDF文档
九、技术支持与引用说明
【数据复现】
- 本数据提供完整的Stata和Python计算代码
- 运行"上市公司独立董事履职行为数据计算代码.do"或".py"即可复现结果
- 代码包含详细注释(注释占比超过40%),便于理解和修改
- 代码执行时间约1-3分钟(取决于数据规模和计算机性能)
【数据评估】
- 运行"上市公司独立董事履职行为数据评估代码.do"或".py"
- 自动生成"评估结果"文件夹,包含:
· 数据分布分析:描述性统计、分年度/行业/地区统计
· 分布图:15+张图表,包括直方图、核密度图、箱线图、趋势图等
· 异常值检验:合理范围检测、统计方法检测、详细列表
· 逻辑合理性验证:4项逻辑检验、相关性矩阵、缺失值统计
· 稳健性测试:不同版本对比、缩尾前后对比、分行业/地区稳定性
- 评估代码执行时间约5-10分钟
【引用建议】
如果您在研究中使用了本数据,建议在论文中说明:
"本文使用的上市公司独立董事履职行为数据,基于中国A股上市公司2004-2024年
独立董事会议出席记录计算得出,包括平均亲自参会率(AATT)、平均委托参会率
(PATT)、最小亲自参会率(MATT)、最大委托参会率(MPATT)和勤勉尽责虚拟
变量(ATT)五个指标。计算方法参考史春玲(2019)的研究。"
十、附录:快速上手指南
【Step 1】了解数据结构
打开任一Excel文件(推荐先看版本2),熟悉变量名称和数据格式
查看AATT、PATT、MATT、MPATT、ATT五个核心指标
【Step 2】选择合适的数据版本
- 主回归 → 版本2(已剔除金融STPT未缩尾版本)
- 稳健性检验 → 版本3(已剔除金融STPT已缩尾版本)
- 全样本分析 → 版本1(未剔除金融STPT版本)
【Step 3】导入数据
Stata示例:
use "计算结果已剔除金融STPT未缩尾版本.dta", clear
describe
summarize AATT PATT MATT MPATT ATT
Python示例:
import pandas as pd
df = pd.read_stata("计算结果已剔除金融STPT未缩尾版本.dta")
print(df.info())
print(df[['AATT', 'PATT', 'MATT', 'MPATT', 'ATT']].describe())
【Step 4】描述性统计
Stata示例:
tabstat AATT PATT MATT MPATT ATT, by(year) stat(mean sd min max) format(%9.4f)
// 查看ATT分布
tab ATT
// 按行业统计
bysort 行业名称: summarize AATT
【Step 5】回归分析
Stata示例(固定效应):
xtset stkcd year
xtreg ROA AATT Size Lev Age, fe vce(cluster stkcd)
// 使用ATT作为自变量
xtreg ROA ATT Size Lev Age, fe vce(cluster stkcd)
// Logit模型
logit 违规 AATT Size Lev Age i.year, vce(cluster stkcd)
Python示例(固定效应):
from linearmodels import PanelOLS
data = df.set_index(['stkcd', 'year'])
model = PanelOLS(data['ROA'], data[['AATT', 'Size', 'Lev', 'Age']],
entity_effects=True, time_effects=True)
result = model.fit(cov_type='clustered', cluster_entity=True)
print(result)
【Step 6】查看数据评估报告(可选)
运行评估代码后,进入"评估结果"文件夹,查看:
- 上市公司独立董事履职行为数据评估日志.smcl(总日志)
- 分布图文件夹:15+张分布和趋势图
- 异常值检验、逻辑验证、稳健性测试结果
祝您研究顺利!
上市公司独立董事履职行为数据2004-2024年含do-python代码和excel-dta格式数据.zip
(16.96 MB, 需要: RMB 39 元)
评估结果.zip
(561.45 KB)


雷达卡



京公网安备 11010802022788号







