常用控制变量
基础版本:https://bbs.pinggu.org/thread-11043247-1-1.html
变量说明
变量 | 符号 | 变量定义 |
公司规模 | Size | 年总资产的自然对数 |
资产负债率 | Lev | 年末总负债除以年末总资产 |
总资产净利润率 | ROA | 净利润/总资产平均余额 |
净资产收益率 | ROE | 净利润/股东权益平均余额 |
销售毛利率 | GrossProfit | (营业收入-营业成本)/营业收入 |
销售净利率 | NetProfit | 净利润/营业收入 |
总资产周转率 | ATO | 营业收入/平均资产总额 |
流动比率 | Liquid | 流动资产/流动负债 |
速动比率 | Quick | (流动资产-存货)/流动负债 |
现金流比率 | Cashflow | 经营活动产生的现金流量净额除以总资产 |
应收账款占比 | REC | 应收账款净额与总资产的比值 |
存货占比 | INV | 存货净额与总资产的比值 |
固定资产占比 | FIXED | 固定资产净额与总资产比值 |
营业收入增长率 | Growth | 本年营业收入/上一年营业收入-1 |
总资产增长率 | AssetGrowth | 本年总资产/上一年总资产-1 |
是否亏损 | Loss | 当年净利润小于0取 1,否则取0 |
董事人数 | Board | 董事会人数取自然对数 |
独立董事比例 | Indep | 独立董事除以董事人数 |
两职合一 | Dual | 董事长与总经理是同一个人为1,否则为0 |
第一大股东持股比例 | Top1 | 第一大股东持股数量/总股数 |
前三大股东持股比例 | Top3 | 前三股东持股数量/总股数 |
前五大股东持股比例 | Top5 | 前五股东持股数量/总股数 |
前十大股东持股比例 | Top10 | 前十股东持股数量/总股数 |
股权制衡度 | Balance1 | 第二大股东持股比例除以第一大股东持股比例 |
股权制衡度 | Balance2 | 第二到五位大股东持股比例的和除以第一大股东持股比例 |
股权赫芬达尔指数 | Herfindahl3 | 公司前3位大股东持股比例的平方和 |
股权赫芬达尔指数 | Herfindahl5 | 公司前5位大股东持股比例的平方和 |
股权赫芬达尔指数 | Herfindahl10 | 公司前10位大股东持股比例的平方和 |
账面市值比 | BM | 账面价值/总市值 |
市净率 | PB | 每股价格/每股净资产 |
托宾Q值 | TobinQ | (流通股市值+非流通股股份数×每股净资产+负债账面值)/总资产 |
是否国有企业 | SOE | 国有控股企业取值为1,其他为0 |
上市年限 | ListAge | ln(当年年份-上市年份+1) |
公司成立年限 | FirmAge | ln(当年年份-公司成立年份+1) |
月均超额换手率 | Dturn | 当年股票月均换手率-去年股票月均换手率 |
机构投资者持股比例 | INST | 机构投资者持股总数除以流通股本 |
管理层持股比例 | Mshare | 管理层持股数据除以总股本 |
管理费用率 | Mfee | 管理费用除以营业收入 |
大股东资金占用 | Occupy | 其他应收款除以总资产 |
是否四大 | Big4 | 公司经由四大(普华永道、德勤、毕马威、安永)审计为1,否则为0。 |
是否十大 | Big10 | 如果境内审计事务所评比得分或收入排名前十名则取值为1,否则为0(根据中注协百强数据判断) |
审计意见 | Opinion | 若公司当年的财务报告被出具了标准审计意见,则取值为1,否则为0 |
审计费用 | AuditFee | 审计费用取自然对数 |
员工人数 | Employee | 员工人数取自然对数 |
管理层平均年龄 | TMTAge | 管理层平均年龄 |
产融结合 | Bank | 是否持有银行股份 |
产融结合2 | FinInst | 是否持有其他金融机构股份 |
管理层女性比例 | Female | 管理层女性人数除以管理层总人数 |
董监高是否具有金融背景 | FinBack | 现任的董监高中是否有人具有金融背景(金融背景包括曾经与现在的工作背景) |
董监高是否具有海外背景 | OverseaBack | 现任的董监高中是否有人具有海外背景(海外背景包括曾经与现在的求学、任职背景) |
管理层前三名薪酬 | TMTPay1 | 上市公司前三名高管薪酬总额的自然对数 |
管理层总薪酬 | TMTPay2 | 上市公司高管薪酬总额的自然对数 |
省份 | Province | 注册地所在省份 |
城市 | City | 注册地所在城市 |
行业 | Industry | 证监会2012年行业分类,制造业取两位代码,其他行业用大类 |
年份 | Year | 年份 |
数据说明
- 数据区间:2000-2021年(注:股权性质从2004年开始,第一大股东持股比例从2003年开始)
- 数据对象:全部A股,不包含已退市的上市公司,不包含上市以前的数据(具体也可以在代码里修改)
- 数据格式:excel和dta格式, dta格式需要Stata 14/15/16/17版本打开,需要安装包可以到该贴下载: 下载地址
结果说明
数据截图
包含基础数据变量
在Stata里已设置好标签,方便查看字段的意义
各变量缺失情况(mdesc命令)
剔除金融行业剔除ST类样本并缩尾后描述性统计(缩尾命令winsor2)
附件下载
结果包括几个版本(满足不同人需求):
- 版本1:未剔除金融行业、ST、*ST或PT上市公司样本,未做缩尾处理
- 版本2:剔除金融行业、ST、*ST或PT上市公司样本,未做缩尾处理
- 版本3:剔除金融行业、ST、*ST或PT上市公司样本,已做缩尾处理
数据均未剔除缺失值,选择自己需要的变量后再剔除缺失值
经管之家:momingiqmiao7
欢迎关注,分享更多实用的数据,独家发布,请勿私自转卖
注意:其他渠道购买无质量保证和售后保障,批量购买可享优惠
【关注】【帖子索引2020年】【帖子索引2021年】【使用常见问题】
【点击查看更多帖子】【Stata软件下载】【Stata免费学习资料】
补充内容 (2023-6-23 11:37):
【重磅推荐】拓展-全部A股上市公司常用控制变量数据整理(2000-2022年)附Stata代码
https://bbs.pinggu.org/thread-11524856-1-1.html