楼主: Ba66
75 0

[经管数据集] 【数据】上市公司独立董事履职行为数据2004-2024年含do-python代码和excel-dta格式数 [推广有奖]

  • 0关注
  • 0粉丝

已卖:40份资源

博士生

15%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.8463
学术水平
5 点
热心指数
5 点
信用等级
5 点
经验
1843 点
帖子
104
精华
0
在线时间
90 小时
注册时间
2025-1-29
最后登录
2025-12-18

楼主
Ba66 发表于 2025-12-10 14:13:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一、数据简介
本数据集基于中国A股上市公司独立董事会议出席记录,计算了五个核心的独立董事
履职行为指标。数据涵盖2004-2024年中国A股上市公司,综合反映了上市公司独立
董事的参会积极性、委托参会情况以及勤勉尽责程度,可用于研究上市公司独立董事
履职行为对公司治理效果、经营业绩和市场表现的影响。


3.jpg


二、核心指标说明
【指标1】独董平均亲自参会率(AATT - Average Attendance)
定义:上市公司所有独立董事亲自参会率的平均值
计算方法:
   第一步:计算每位独立董事的个人亲自参会率 = 亲自出席次数/应参加总数
   第二步:对该上市公司所有独立董事求平均值
取值范围:[0, 1],连续变量
研究意义:反映上市公司独立董事整体参会积极性,数值越大表示独立董事越积极
          参与公司会议,履职更加主动


【指标2】独董平均委托参会率(PATT - Proxy Attendance)
定义:上市公司所有独立董事委托参会率的平均值
计算方法:
   第一步:计算每位独立董事的个人委托参会率 = 委托出席次数/应参加总数
   第二步:对该上市公司所有独立董事求平均值
取值范围:[0, 1],连续变量
研究意义:反映上市公司独立董事委托他人参会的普遍程度,数值越大表示独立董事
          委托参会越频繁,可能存在履职不充分的问题


【指标3】独董最小亲自参会率(MATT - Minimum Attendance)
定义:上市公司所有独立董事亲自参会率的最小值
计算方法:
   第一步:计算每位独立董事的个人亲自参会率 = 亲自出席次数/应参加总数
   第二步:取该上市公司所有独立董事的最小值
取值范围:[0, 1],连续变量
研究意义:识别上市公司中参会最不积极的独立董事表现,可用于检测是否存在
          "挂名独董"问题。数值越低表示至少有一位独立董事参会很不积极


【指标4】独董最大委托参会率(MPATT - Maximum Proxy Attendance)
定义:上市公司所有独立董事委托参会率的最大值
计算方法:
   第一步:计算每位独立董事的个人委托参会率 = 委托出席次数/应参加总数
   第二步:取该上市公司所有独立董事的最大值
取值范围:[0, 1],连续变量
研究意义:识别上市公司中委托参会最频繁的独立董事表现,可用于检测是否存在
          严重的履职缺位问题。数值越高表示至少有一位独立董事经常委托参会


【指标5】独董是否勤勉(ATT - Attendance Threshold)★核心指标★
定义:上市公司所有独立董事是否均达到勤勉尽责标准的二元变量
计算方法:
   第一步:计算MATT(最小亲自参会率)
   第二步:若MATT > 2/3,则ATT = 1;否则ATT = 0
取值范围:{0, 1},二元变量
          - ATT = 1:上市公司所有独立董事参会率均超过2/3,整体勤勉尽责
          - ATT = 0:上市公司至少有一位独立董事参会率≤2/3,存在履职不足
理论依据:2/3阈值参考《上市公司治理准则》对董事履职的要求
研究意义:该指标可直接用于识别上市公司独立董事整体履职质量,适用于
          二元选择模型(Logit/Probit)和倾向得分匹配(PSM)分析




5.jpg




三、数据文件结构
【原始数据文件】
1. 上市公司独立董事履职会议数据.dta
   - 包含每位独立董事的会议出席记录
   - 字段:证券代码、年份、独立董事姓名、应参加会议总数、亲自出席次数、
          委托出席次数等


2. 上市公司行业与地区信息数据.dta
   - 包含上市公司基本信息
   - 字段:证券代码、证券简称、行业代码、行业名称、所属省份、所属城市等


【计算结果文件(三个版本)】
版本1:计算结果未剔除金融STPT版本.dta / .xlsx
   适用场景:需要全样本分析的研究
   样本范围:保留所有A股上市公司(剔除B股)
   数据处理:未进行行业剔除和极端值处理
   推荐用途:描述性统计、全市场分析、行业对比研究


版本2:计算结果已剔除金融STPT未缩尾版本.dta / .xlsx
   适用场景:一般实证研究的主回归分析
   样本范围:剔除金融业(行业代码含"J")和ST、PT等特殊处理上市公司
   数据处理:剔除异常样本,但保留原始数据分布
   推荐用途:主回归分析、机制检验、异质性分析


版本3:计算结果已剔除金融STPT已缩尾版本.dta / .xlsx
   适用场景:稳健性检验和对极端值敏感的分析
   样本范围:同版本2
   数据处理:在版本2基础上,对AATT、PATT、MATT、MPATT、ATT五个指标
             按年度进行前后1%缩尾处理
   推荐用途:稳健性检验、减少极端值影响的回归分析

4.jpg


【代码文件】
1. 上市公司独立董事履职行为数据计算代码.do(Stata版本)
   - 兼容Stata 15及以上版本
   - 使用UTF-8编码
   - 包含详细注释,注释占比超过40%


2. 上市公司独立董事履职行为数据计算代码.py(Python版本)
   - 需要pandas、numpy库
   - 与Stata版本逻辑完全一致
   - 适用于Python数据分析环境


3. 上市公司独立董事履职行为数据评估代码.do / .py
   - 自动化数据质量评估
   - 生成"评估结果"文件夹,包含:
     · 数据分布分析(描述性统计、分年度/行业/地区统计)
     · 分布图(直方图、核密度图、箱线图、年度趋势图等)
     · 异常值检验(合理范围检测、3倍标准差法、IQR方法)
     · 逻辑合理性验证(MATT≤AATT、MPATT≥PATT、ATT与MATT一致性等)
     · 稳健性测试(不同版本对比、缩尾前后对比、分行业/地区稳定性)


1.jpg


2.jpg




四、变量详细说明
【基础标识变量】
变量名         | 类型   | 说明
--------------|--------|-----------------------------------------------
证券代码       | 字符串 | 上市公司6位证券代码(如"000001")
证券简称       | 字符串 | 上市公司简称(如"平安银行")
stkcd         | 数值   | 证券代码的数值形式
year          | 数值   | 年份(2004-2024)


【核心指标变量】
变量名         | 类型   | 取值范围 | 说明
--------------|--------|---------|---------------------------------------
AATT          | 数值   | [0, 1]  | 独董平均亲自参会率
PATT          | 数值   | [0, 1]  | 独董平均委托参会率
MATT          | 数值   | [0, 1]  | 独董最小亲自参会率
MPATT         | 数值   | [0, 1]  | 独董最大委托参会率
ATT           | 0/1    | {0, 1}  | 独董是否勤勉(1=勤勉)


【行业与地区变量】
变量名         | 类型   | 说明
--------------|--------|-----------------------------------------------
行业代码       | 字符串 | 证监会行业分类代码
行业名称       | 字符串 | 上市公司所属行业名称
所属省份       | 字符串 | 上市公司注册地省份
所属省份代码   | 字符串 | 省份代码
所属城市       | 字符串 | 上市公司注册地城市
所属城市代码   | 字符串 | 城市代码




五、数据样本说明
【时间跨度】2004-2024年(21年)


【样本范围】
- 基础样本:中国A股上市公司
- 剔除样本:
  · B股(证券代码以2或9开头)
  · 金融业(行业代码包含"J",仅在版本2和版本3中剔除)
  · ST、PT等特殊处理上市公司(仅在版本2和版本3中剔除)


【数据特征】
- 数据结构:非平衡面板数据(Unbalanced Panel Data)
- 观测频率:年度数据
- 缺失值处理:无独立董事会议记录的上市公司-年份观测值已被剔除


【样本量参考】(具体样本量根据实际数据可能有所不同)
- 版本1(未剔除):约40,000+观测值
- 版本2(已剔除):约35,000+观测值
- 版本3(已缩尾):与版本2样本量相同,但数值分布有调整


【指标相关性】
根据数据评估结果,五个指标间存在预期的相关性:
- AATT与PATT:强负相关(r ≈ -0.92)- 亲自参会多则委托少
- AATT与MATT:强正相关(r ≈ 0.90)- 平均值与最小值同向变动
- PATT与MPATT:强正相关(r ≈ 0.90)- 平均值与最大值同向变动
- ATT与MATT:较强正相关(r ≈ 0.76)- 勤勉度与最小参会率正相关




六、数据质量说明
【数据来源质量】
- 原始数据来源于上市公司年报披露的独立董事会议出席记录
- 数据符合中国证监会信息披露要求
- 行业与地区信息来自主流金融数据库


【计算准确性】
- 指标计算基于成熟的公司治理研究方法
- 代码经过严格测试和逻辑验证
- 提供Stata和Python双语言版本,可交叉验证
- 附带完整的数据质量评估报告


【数据完整性】
- 保留了上市公司基础信息(代码、简称、行业、地区)
- 提供三个版本数据,满足不同研究需求
- 附带完整的计算代码和评估代码,可追溯和复现


【逻辑合理性】
根据评估代码检验,数据满足以下逻辑关系:
1. MATT ≤ AATT(最小值≤平均值)
2. MPATT ≥ PATT(最大值≥平均值)
3. AATT + PATT ≤ 1(亲自+委托≤总会议)
4. ATT=1 ⟺ MATT>2/3(勤勉标准与最小参会率一致)


【异常值处理】
- 版本1和版本2:保留原始数据分布,所有指标值在[0,1]合理范围内
- 版本3:对五个指标按年度进行1%缩尾处理
- 详细的异常值检验报告见"评估结果/异常值检验"文件夹




七、使用建议
【研究设计建议】
1. 主回归分析:建议使用版本2(已剔除金融STPT未缩尾版本)
   - 剔除了金融业和异常样本,符合常规实证研究惯例
   - 保留了原始数据分布,便于经济意义解释
   - 适用于研究独立董事履职对上市公司业绩、风险等的影响


2. 稳健性检验:建议使用版本3(已剔除金融STPT已缩尾版本)
   - 可用于检验极端值对回归结果的影响
   - 也可作为主回归的替代方案


3. 全样本分析:建议使用版本1(未剔除金融STPT未缩尾版本)
   - 适用于需要包含金融业的研究
   - 适用于行业对比研究(如比较金融业与非金融业独董履职差异)


【实证模型建议】
1. 固定效应模型(Fixed Effects Model)
   - 控制上市公司个体固定效应和年份固定效应
   - 代码示例(Stata):
     xtreg Y AATT 控制变量, fe vce(cluster stkcd)
   - 适用于研究独立董事履职对连续型因变量的影响


2. 双向固定效应模型(Two-way Fixed Effects)
   - 控制上市公司固定效应和年份固定效应
   - 代码示例(Stata):
     reghdfe Y AATT 控制变量, absorb(stkcd year) vce(cluster stkcd)
   - 适用于大样本面板数据分析


3. Logit/Probit模型
   - 使用ATT作为自变量或因变量
   - 代码示例(Stata):
     logit Y ATT 控制变量, vce(cluster stkcd)
   - 适用于研究独立董事勤勉度的影响或决定因素


4. 倾向得分匹配(PSM)
   - 使用ATT作为处理变量
   - 比较勤勉(ATT=1)和不勤勉(ATT=0)的上市公司
   - 代码示例(Stata):
     psmatch2 ATT 控制变量, outcome(Y) ate


【控制变量建议】
1. 上市公司层面:
   - 企业规模(资产总额、营业收入的对数)
   - 盈利能力(ROA、ROE)
   - 成长能力(营收增长率、托宾Q)
   - 财务杠杆(资产负债率)
   - 股权结构(第一大股东持股比例、股权制衡度)
   - 企业年龄(上市年限、成立年限)
   - 董事会特征(董事会规模、独立董事比例)


2. 独立董事特征(如果数据可得):
   - 独立董事背景(学术型、政府型、商业型)
   - 独立董事任期
   - 独立董事薪酬
   - 独立董事兼职数量


3. 公司治理层面:
   - 两职合一(董事长与总经理是否同一人)
   - 管理层持股比例
   - 机构投资者持股比例


4. 行业与宏观层面:
   - 行业竞争度
   - 行业固定效应
   - GDP增长率
   - 年份固定效应


【注意事项】
1. 指标选择:
   - AATT和MATT最常用,分别反映平均水平和最差情况
   - ATT适用于二元分析和分组比较
   - 可同时使用多个指标进行稳健性检验


2. 内生性问题:
   - 独立董事履职可能与公司业绩存在双向因果关系
   - 建议使用工具变量(IV)或系统GMM方法
   - 可考虑使用省份平均独董参会率作为工具变量
   - 可使用滞后变量减轻内生性


3. 异质性分析:
   - 可按行业、地区、企业规模、所有制性质等进行分组回归
   - 可使用交互项检验调节效应
   - 建议关注国有企业与非国有企业的差异


4. 稳健性检验:
   - 更换核心解释变量(如用MATT替代AATT)
   - 更换样本区间(排除特殊年份如金融危机期间)
   - 更换模型设定(如使用Tobit模型处理截断数据)
   - 使用版本3的缩尾数据




八、参考文献
本数据的理论基础和计算方法参考以下文献:


[1] 史春玲. (2019). 独立董事出席会议与发表意见:合规性履职还是有效性履职.
    管理评论, 31(11), 204-216.
    (独立董事履职行为测度的经典文献)


[2] 史春玲. (2020). 董事高管责任保险与独立董事履职行为研究.
    金融研究, (7), 170-188.
    (独立董事履职行为影响因素研究)


[3] Fama, E. F., & Jensen, M. C. (1983). Separation of ownership and control.
    The Journal of Law and Economics, 26(2), 301-325.
    (公司治理理论基础)


[4] Adams, R. B., & Ferreira, D. (2009). Women in the boardroom and their
    impact on governance and performance. Journal of Financial Economics,
    94(2), 291-309.
    (董事会出席率与公司治理研究)


[5] 配套参考文献:
    详见本文件夹中的PDF文档




九、技术支持与引用说明
【数据复现】
- 本数据提供完整的Stata和Python计算代码
- 运行"上市公司独立董事履职行为数据计算代码.do"或".py"即可复现结果
- 代码包含详细注释(注释占比超过40%),便于理解和修改
- 代码执行时间约1-3分钟(取决于数据规模和计算机性能)


【数据评估】
- 运行"上市公司独立董事履职行为数据评估代码.do"或".py"
- 自动生成"评估结果"文件夹,包含:
  · 数据分布分析:描述性统计、分年度/行业/地区统计
  · 分布图:15+张图表,包括直方图、核密度图、箱线图、趋势图等
  · 异常值检验:合理范围检测、统计方法检测、详细列表
  · 逻辑合理性验证:4项逻辑检验、相关性矩阵、缺失值统计
  · 稳健性测试:不同版本对比、缩尾前后对比、分行业/地区稳定性
- 评估代码执行时间约5-10分钟


【引用建议】
如果您在研究中使用了本数据,建议在论文中说明:
"本文使用的上市公司独立董事履职行为数据,基于中国A股上市公司2004-2024年
独立董事会议出席记录计算得出,包括平均亲自参会率(AATT)、平均委托参会率
(PATT)、最小亲自参会率(MATT)、最大委托参会率(MPATT)和勤勉尽责虚拟
变量(ATT)五个指标。计算方法参考史春玲(2019)的研究。"



十、附录:快速上手指南
【Step 1】了解数据结构
打开任一Excel文件(推荐先看版本2),熟悉变量名称和数据格式
查看AATT、PATT、MATT、MPATT、ATT五个核心指标


【Step 2】选择合适的数据版本
- 主回归 → 版本2(已剔除金融STPT未缩尾版本)
- 稳健性检验 → 版本3(已剔除金融STPT已缩尾版本)
- 全样本分析 → 版本1(未剔除金融STPT版本)


【Step 3】导入数据
Stata示例:
  use "计算结果已剔除金融STPT未缩尾版本.dta", clear
  describe
  summarize AATT PATT MATT MPATT ATT


Python示例:
  import pandas as pd
  df = pd.read_stata("计算结果已剔除金融STPT未缩尾版本.dta")
  print(df.info())
  print(df[['AATT', 'PATT', 'MATT', 'MPATT', 'ATT']].describe())


【Step 4】描述性统计
Stata示例:
  tabstat AATT PATT MATT MPATT ATT, by(year) stat(mean sd min max) format(%9.4f)
  
  // 查看ATT分布
  tab ATT
  
  // 按行业统计
  bysort 行业名称: summarize AATT


【Step 5】回归分析
Stata示例(固定效应):
  xtset stkcd year
  xtreg ROA AATT Size Lev Age, fe vce(cluster stkcd)
  
  // 使用ATT作为自变量
  xtreg ROA ATT Size Lev Age, fe vce(cluster stkcd)
  
  // Logit模型
  logit 违规 AATT Size Lev Age i.year, vce(cluster stkcd)


Python示例(固定效应):
  from linearmodels import PanelOLS
  data = df.set_index(['stkcd', 'year'])
  model = PanelOLS(data['ROA'], data[['AATT', 'Size', 'Lev', 'Age']],
                   entity_effects=True, time_effects=True)
  result = model.fit(cov_type='clustered', cluster_entity=True)
  print(result)


【Step 6】查看数据评估报告(可选)
运行评估代码后,进入"评估结果"文件夹,查看:
- 上市公司独立董事履职行为数据评估日志.smcl(总日志)
- 分布图文件夹:15+张分布和趋势图
- 异常值检验、逻辑验证、稳健性测试结果

祝您研究顺利!

上市公司独立董事履职行为数据2004-2024年含do-python代码和excel-dta格式数据.zip (16.96 MB, 需要: RMB 39 元)

评估结果.zip (561.45 KB)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python EXCEL 上市公司 独立董事 xcel

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 20:26