数据主题:A股上市公司所处行业的年度盈利能力(行业平均利润率)
样本范围:A股上市公司(剔除B股;已剔除版本额外剔除金融业与ST/PT)
时间跨度:2000—2024年
观测单位:上市公司—年(stkcd × year)
文件格式:.dta(Stata格式)与 .xlsx(Excel格式),数据内容完全一致
配套代码:
计算脚本:上市公司行业盈利能力数据计算代码.do / .py
评估脚本:上市公司行业盈利能力数据评估代码.do / .py
二、核心指标构造方法
1. 上市公司利润率
利润率(i,t) = 净利润(i,t) / 营业收入(i,t)
2. 上市公司所处行业盈利能力(行业当年平均利润率)
行业盈利能力(j,t) = (1/N_{j,t}) * Σ_{i∈j} 利润率(i,t)
其中 j 为行业代码,t 为年份。
三、计算结果版本(共三版)
版本1:计算结果未剔除未缩尾版本.dta / .xlsx
仅剔除B股,保留全部其他样本。
版本2:计算结果已剔除金融STPT未缩尾版本.dta / .xlsx
额外剔除空证券、金融业(行业代码以J开头)、ST/PT公司。
版本3:计算结果已剔除金融STPT已缩尾版本.dta / .xlsx
在版本2基础上,对"行业盈利能力"按年度做1%/99%缩尾处理。
四、变量列表
序号 变量名 类型 说明
01 证券代码 字符 上市公司证券代码
02 证券中文简称 字符 上市公司中文简称
03 stkcd 数值 上市公司股票代码(数值形式)
04 year 数值 年份
05 股票类型 字符 A股/B股/H股等标识
06 ABH股交叉码 字符 A/B/H股交叉码
07 公司名称 字符 公司名称
08 公司中文简称 字符 公司中文简称
09 公司英文名称 字符 公司英文名称
10 上市日期 日期 公司上市日期
11 成立日期 日期 公司成立日期
12 退市日期 日期 公司退市日期(若有)
13 注册资本 数值 注册资本
14 所属省份 字符 所属省份
15 所属省份代码 数值 省份代码
16 所属城市 字符 所属城市
17 所属城市代码 数值 城市代码
18 行业代码 字符 主行业代码
19 行业名称 字符 主行业名称
20 行业代码A~D 字符 分级行业代码
21 行业名称A~D 字符 分级行业名称
22 *净利润 数值 公司当年净利润(元)
23 *营业收入 数值 公司当年营业收入(元)
24 *利润率 数值 利润率 = 净利润 / 营业收入
25 *行业盈利能力 数值 行业当年平均利润率【核心指标】
26 经营范围 字符 说明性文本
27 公司沿革 字符 说明性文本
五、数据源
- 上市公司净利润、营业收入与行业地区信息:
上市公司净利润营业收入与行业地区信息数据.dta
- 上市公司基本信息:
行业代码/上市公司基本信息数据.dta
六、样本处理说明
1. B股剔除:证券代码以"2"或"9"开头的样本视为B股并剔除。
2. 金融业剔除:行业代码以"J"开头的公司视为金融业并剔除。
3. ST/PT剔除:证券中文简称中包含"ST"或"PT"的公司剔除。
4. 缩尾处理:仅对核心指标"行业盈利能力"按年份做1%/99%分位缩尾。
七、数据质量评估
执行配套评估脚本将自动生成 数据质量评估报告_YYYYMMDD 文件夹:
01_数据分布分析/ 描述性统计、频率分布、分年/行业/省份均值
02_分布图/ 直方图、箱线图、核密度、散点图矩阵、时间趋势、CDF
03_异常值检验/ IQR法、Z-score法、缺失值统计、异常值散点
04_逻辑合理性验证/ 时间序列连续性、指标范围、标识唯一性、组内一致性
05_稳健性测试/ 三版本对比、前后期对比、缩尾效果验证
评估日志_YYYYMMDD.log
数据质量评估报告_20260424.zip
(2.33 MB)
上市公司行业盈利能力数据2000-2024年含do-python代码和excel-dta格式数据.zip
(68.79 MB, 需要: RMB 32 元)


雷达卡



京公网安备 11010802022788号







