公司规模(Size1)=ln(年末总资产)
公司规模(Size2)=ln(营业收入)
资产负债率(Lev)=年末总负债/年末总资产
总资产收益率(Roa)=净利润/总资产平均余额
净资产收益率(Roe)=净利润/股东权益平均余额
销售利润率(Ros)=利润总额/营业收入
管理费用率(Mfee)=管理费用/营业收入
总资产周转率(ATO)=营业收入/平均资产总额
经营性现金流(Cashflow)=经营活动产生的现金流量净额/总资产
自由现金流(FCF)= (经营活动现金净流量+投资活动现金净流量-利息支出)/ 营业收入
现金持有(Cash1)=货币资金/总资产
现金持有(Cash2)=(货币资金+交易性金融资产)/总资产
应收账款占比(Receivable)=应收账款净额/总资产
存货占比(Inventory)=存货净额/总资产
业务复杂程度(ARLNV)=(应收账款净额+存货净额)/总资产
固定资产占比(Fixed)=固定资产净额/总资产
无形资产占比(Intang)=无形资产净额/总资产
有形资产占比(Tang)=(固定资产净额+存货净额)/总资产
投资收益率(ROI)=投资收益/总资产
大股东资金占用(Occupy)=其他应收款/总资产
营业收入增长率/成长能力(Growth)=本年营业收入/上年营业收入-1=(本年营业收入-上年营业收入)/上年营业收入
是否亏损(Loss):当年净利润小于0取 1,否则取0
有息债务比例/有息资产负债率(Debt)=(短期借款+长期借款+应付债券)/总资产
非债务税盾(DEP)=累计折旧/总资产
独立董事比例(Indep)=独立董事/董事人数
董事会规模(Board)=ln(董事会人数)
监事会规模(Supervise)=ln(监事会人数)
董事会会议次数(Dmeet)=ln(董事会会议次数)
监事会会议次数(Smeet)=ln(监事会会议次数)
股东大会会议次数(SHmeet)=ln(股东大会会议次数)
员工人数(Employee)=ln(员工人数)
两职合一(Dual):若董事长兼任总经理取1,否则为0
高管薪酬(Pay)=ln(前三名高管薪酬)
管理层持股比例(Mshare)=管理层持股数量/总股本
董事会持股比例(Boardshare)=董事会持股数量/总股本
监事会持股比例(Supershare)=监事会持股数量/总股本
机构投资者持股比例(INST)=机构投资者持股总数/流通股本
第一大股东持股比例(Top1)=第一大股东持股数量/总股数
前三大股东持股比例(Top3)=前三大股东持股数量/总股数
前五大股东持股比例(Top5)=前五大股东持股数量/总股数
前十大股东持股比例(Top10)=前十大股东持股数量/总股数
第一大股东持股比例平方(Top1squ)=第一大股东持股比例平方
前三大股东持股比例平方和(Top3squ)=前三大股东持股比例平方和
前五大股东持股比例平方和(Top5squ)=前五大股东持股比例平方和
前十大股东持股比例平方和(Top10squ)=前十大股东持股比例平方和
股权制衡度(Balance1)=第二大股东持股比例/第一大股东持股比例
股权制衡度(Balance2)=第二到三位大股东持股比例的和/第一大股东持股比例
股权制衡度(Balance3)=第二到五位大股东持股比例的和/第一大股东持股比例
股权制衡度(Balance4)=第二到十位大股东持股比例的和/第一大股东持股比例
账面市值比(BM)=账面价值/总市值
市值账面比(MB)=总市值/账面价值
托宾Q值(TobinQ)=(流通股市值+非流通股股份数×每股净资产+负债账面价值)/总资产
股权性质/产权性质(SOE):根据实际控制人判断,若为国企取值为1,其他为0
公司上市年限(ListAge)=ln(当年年份-上市年份+1)
公司成立年限(FirmAge)=ln(当年年份-公司成立年份+1)
分析师关注度(Analyst)=ln(公司分析师跟踪人数+1)
事务所规模(Big4):若公司当年聘请国际四大会计师事务所(普华永道、德勤、安永、毕马威)进行审计为1,否则为0。
审计意见(Opinion):若公司当年的财务报告被出具了标准审计意见,则取值为1,否则为0
行业(Industry):行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算
年份(Year):年份虚拟变量
2.数据说明
样本选择:全部A股1990-2021年数据
注:
(1)初始数据中部分数据并非从1990年开始,对此做出如下汇总说明:
“经营活动产生的现金流量净额、投资活动产生的现金流量净额、固定资产折旧油气资产折耗生产性生物资产折旧、机构投资者持股”数据是从1998年开始
“董事长与总经理兼任情况、员工人数、董事人数、其中独立董事人数、监事人数、董事会持股数量、监事会持股数量、监管层持股数量、监管层前三名薪酬总额”数据是从1999年开始
“审计意见类型 审计师是否来自国际四大”数据是从2000年开始
“董事会会议次数 监事会会议次数 股东大会召开次数”数据是从2001年开始
“股权集中指标1、股权集中指标2、股权集中指标3、股权集中指标4、Z指数、H指数、Herfindahl_3指数、Herfindahl_5指数、Herfindahl_10指数、分析师关注人数”数据是从2003年开始
“股权性质”数据是从2003年开始
(2)未做任何剔除处理,但在初始数据中提供了剔除变量所需的数据,可根据需要自行剔除。在“计算代码”中提供的剔除代码如下:
剔除金融行业的样本;剔除当年年末被ST、*ST或PT的上市公司;剔除公司上市之前的样本;剔除已经退市的上市公司样本;剔除交叉上市的公司数据;剔除资产负债率大于1的异常值;剔除同行业中少于10家样本的企业,数值可根据参考文献自行调整
(3)未做缩尾处理,但提供了缩尾处理的代码,可自行缩尾,对连续型变量进行1%和99%分位数的缩尾处理。
3.参考文献
所有变量均是根据顶刊构造
压缩包中附有初始数据,计算代码和最终数据
压缩包所含文件:
![压缩包所含文件.png 压缩包所含文件.png](https://bbs-cdn.datacourse.cn/static/image/common/none.gif)
数据样例:
分年份数据量统计:
缩尾前的描述性统计结果:
![缩尾前的描述性统计结果.png 缩尾前的描述性统计结果.png](https://bbs-cdn.datacourse.cn/static/image/common/none.gif)
缩尾后的描述性统计结果:
![缩尾后的描述性统计结果.png 缩尾后的描述性统计结果.png](https://bbs-cdn.datacourse.cn/static/image/common/none.gif)
![](https://bbs-cdn.datacourse.cn/static/image/filetype/rar.gif)
- 初始数据.xlsx
- 控制变量.xlsx
- 计算代码.do
- 控制变量.dta
补充内容 (2022-12-7 10:55):
数据已更新,请移步:https://bbs.pinggu.org/forum.php ... ;extra=#pid84343063